
UCSD机构审查委员会(IRB)提供了对校园临床样本的激发实验室获得的数据的人类主题保护监督(IRB批准#210699和#200477)。获得了所有必要的患者和/或参与者的同意,并已存档适当的机构表格,并鉴定了任何样本标识符。该项目的废水组成部分与我们的IRB讨论了,并不被视为人类学科研究,因为它没有记录个人身份信息。
在360个校园建筑物的人孔或下水道清理处部署了收集24小时加权复合材料的一百三十架废水自动采样器。GIS信息分析以及基于代理的网络模型对UCSD校园中的SARS-COV-2传输促进了对废水采样最佳位置的识别。在飞行员阶段(11月23日至2020年12月29日),将68个采样器优先考虑,覆盖239座住宅建筑物,被确定为校园中大型爆发的最高风险区域,这是对高密度建筑物中废水监测的观察性研究的一部分29。这是基于初步动态建模,该模型显示出最大的住宅建筑物内的潜在爆发最大。除了对这些高密度建筑物中废水监测的观察性研究外,还同时进行了簇随机研究。其中包括一个随机修改版本的阶梯楔形跨界设计,其中有人孔分配了用于废水采样的人孔。与住宅建筑物相关的人孔集群被随机分配,以在两次措施之一中接收废水监视器,以评估废水监测对相关建筑物中爆发量的影响。在同一时期,所有这些住所中的学生均已要求进行每周的诊断测试,该测试用于验证建筑级废水监测的实用性。此外,由于人口的相对静态性质,校园住宅最初是集中的,这使废水监视的灵敏度和功效更加可靠。然后增加了废水监视的覆盖范围,以覆盖其余的校园建筑物(包括校园的非住宅建筑物) 从2021年1月开始,已部署的四个废水采样器涵盖了校园上指定的隔离和隔离建筑。
每天从131个采样器中收集废水复合材料,用于校园内居民大楼,周一至周五为非住宅校园建筑物收集。在2021年11月23日至2021年9月20日之间,收集了废水样品(n = 19,944),并通过QPCR通过QPCR(RT – QPCR)进行分析,以通过QPCR(RT-QPCR)存在SARS-COV-2 RNA。在此期间,有9,700名学生居住在校园住宅中,每天有25,000名学生在校园内工作。在2020年10月至2021年1月1日之间,所有校园居民均被授权每两周(每2周一次)和每周一次的每周一次(一次)从2021年1月2日开始进行测试(冬季学期的开始)。但是,完全接种疫苗的个体未定期进行测试。校园协议要求学生对居住在聚集住房中的SARS-COV-2的学生肯定,以搬迁到指定的隔离住房。因此,我们对废水阳性的分析(图1B)不包括隔离壳采样器,以控制(最好的控制),因为允许少数非群落住房空间中的少数学生可以隔离“到位”,例如,由于受感染的人的延长而导致的重复检测可能会重复检测。将自动化的局部废水触发通知发送给了与正面废水信号相关的居民和/或雇员,这进一步导致了相关建筑中测试2至40倍的摄取率的增长。
每周从主要的泵站收集二十四个小时的流量加权复合材料,用于洛玛废水处理厂,该工厂是为更大的圣地亚哥县提供的主要处理厂,集水集约为230万。在2021年2月24日至2022年2月7日之间收集了废水样品(n = 132)。
SARS-COV-2 RNA从10 mL的原始污水中浓缩,并如其他地方进行处理。简而言之,基于自动亲和力捕获磁性水凝胶颗粒(CERES纳米科学公司)的浓度方法将病毒RNA浓缩,然后将核酸提取并在50 µL洗脱缓冲液中洗脱。然后,通过实时RT-QPCR将提取的RNA用于三个基因靶标(N1,N2和E-Gene)的SARS-COV-2 RNA。还筛选了PMMOV(胡椒温和的mottle病毒)以调整负载变化。在收集的1-2周内对阳性废水样品进行了测序,与临床样品的延迟相当。为了交叉估算,解毒素中的反卷积工具在废水中可靠解析菌株的混合物,该县的废水样品以及校园中的隔离宿内的样品(在校园内的隔离温度(其中多个受感染的个体正在隔离)也通过靶向八个突变的PCR集合量与VOT菌株相关联。使用RT -QPCR在废水中筛选的突变包括N501Y,DELHV69/70,DELY144,K417N,K417T,E484Q,P681R和L452R(CS3174B02,Promega Corp.)。
Swift正常合酶扩增子面板(SNAP)试剂盒(PN:SN-5X296(CORE)COVG1V2-96(AMPLICON PRIMERS),集成的DNA Technologies)在RNA上用于从废水样品上使用SARS-COV-2 RNA的阳性,用于SARS-COV-2 RNA,用于使用SARS-COV-2 RNA使用SNESCOV-2 RNA,以准备多重下列序列(NGS)。双重索引寡核体,每个池的索引对1,536对。该方案的微型版本与以下修改一起使用:将Superscript IV Vilo(Thermo Fisher)cDNA合成反应缩小至大约一十二三分之二,将正常反应体积与0.333 µL的酶混合物和1.333 µL RNA使用。将多重扩增子扩增和Ampure XP珠纯化步骤缩小大约是正常反应体积的六分之一。将索引适配器PCR和Ampure XP珠纯化步骤缩放到正常反应体积的大约三三十三。最终的库重悬量为29 µL。在每个库中,将1 µL合并,以使用纳米流动池在Miseq(Illumina)上运行的初始浅NG。使用Novaseq SP或S4流动池(Illumina),该相等体积池用于估计样品之间相似读取深度所需的差分体积。根据Miseq纳米运行提供的数据,将5 µL至0.2 µL的库材料之间的材料移入一个池中,以进行Novaseq运行。将传输量限制为5 µL以减少移液的时间,因为这些类型的“大量”样品通常包含较高比例的可能的适配器二聚体,这些衔接二聚体抑制了所有样品的流动池性能。根据步骤,使用蜻蜓发现(SPT LabTech)来分配反应大师混合或水。在Ampurexp珠反应步骤中,使用了一个蓝洗(Bluecatbio)进行高通量离心384孔板洗涤。IKA MS3控制线性板搅拌机(IKA Works Inc.)设置为2,600 R.P.M.在补液步骤中,使用5分钟来重悬Ampurexp珠。蚊子基因组学HV 16通道机器人液体处理程序(SPT LABTECH)用于分配RNA,反应主混合并为初始的Miseq Nano(Illumina)平衡运行准备相等的体积池。Mosquito X1单渠道“ HIT PICKER”机器人液体处理程序(SPT LabTech)用于Novaseq(Illumina)NGS Lanes的最终库平衡。
使用C-View(COVID-19病毒流行病学工作流)平台分析测序数据,以进行初始质量控制和SARS-COV-2谱系分配和系统发育学。简而言之,将测序读数与MiniMAP2(参考文献30)对齐,并使用IVAR TRIM Method20应用底漆序列修剪和质量过滤。使用SamTools Mpileup31和Ivar变体方法20获得了测序深度和SNV调用。
在样品加工的所有阶段包括对照(病毒浓度,提取,QPCR和测序),以评估潜在的抑制和交叉污染。大多数样品处理步骤都是通过液体处理机器人进行的,以保持一致性并最大程度地减少人体错误。所有废水样品都包含重复。如果任何控件都失败或指示交叉污染,则整个批次是重新运行的。由于两种样本类型之间的病毒负荷存在显着差异,因此分别处理临床样品和废水样品进行测序。
如先前报道的20,病毒SNV被用来表征从废水和临床样品中得出的种群。丰富度定义为SNV站点的总数,平均香农熵的定义为:
在第i-th地点,n个位点的n个位点的SNV频率在哪里。为了进行统计测试,使用所有废水样品进行了Mann-Whitney U检验,这些废水样品在10天内未从同一来源采样,以最大程度地提高样品之间的独立性以及所有临床样本。效应大小是使用等级 - 生物相关性计算的,其中u是Mann-Whitney测试统计量,并且分别是废水和临床样品的数量。
为了推断废水样品中的相对丰度,我们使用了一个“条形码”矩阵,该基质包含每个已知病毒谱系的谱系定义突变:
其中表示突变时的第i-theneage。使用Matutils包装15从Usher全局系统发育树中获得了谱系定义突变。同样,我们让B和D编码每个突变的频率和相应的测序深度(使用log-transform来调整整个扩增子深度的较大差异,我们用来控制异性恋性,而下降量的重要性很少或没有测序深度):
然后,我们能够将其作为约束的(加权)最小绝对偏差问题进行写入:
它产生的“解散”向量指定了每种已知单倍型的相对丰度。分析仅对覆盖率大于70%的样品进行,除了来自UCSD的三月样品外,所有覆盖范围都大于50%的样品。使用CVXPY凸优化软件包32,33在Python中进行了约束最小化。使用来自爆发的策划谱系数据进行谱系(VOC,VOIS等)的谱系映射(VOC,VOIS等)。我们注意到,Epsilon变体在美国疾病预防控制中心(CDC)和谁分别分配了VOC和VOI状态,获得了不同的最大升级水平。由于Epsilon的变体在加利福尼亚州和美国大部分地区都广泛,因此我们使用了更“本地”的CDC名称。
在核苷酸水平上通过基于在所有站点的读取深度的多项式分布进行重新采样来进行重新采样,在每个站点上进行了启动概率,在每个站点上确定了事件概率的确定,每个站点在每个站点上发现的总样本读取的比例,然后根据每个位点的次级重新采样,然后根据一个差异分布确定了一个差异(即仅在binomial的情况下),该频率仅在binemial的情况下(即在该位置),而该位点的频率(即在该位点),而该位点的范围是,则该位点的范围是,该位点是一个snev(即在该站点上),在该位点上,该位点的范围是在该站点上,该位点的范围是在该位点上的一个snv,则在该站点上,该位点的频率是一个snev。位点,试验的数量由测序深度给出。对所有样品进行了解采样和解混合(n = 1,000)。
从感染了五种SARS-COV-2菌株之一的哺乳动物细胞培养物的上清液中分离RNA(a,b.1.1.7,b.1.351,p.1或b.1.617.2)。
使用Thermo Covid-19测试试剂盒(PN:A47814,Thermo Scientific Corporation),通过UCSD激发共同测试实验室对病毒浓度进行定量。计算中位周期定量(CQ)值(N-GENE,ORF1AB和S-GEN(如果适用)),并用于确定需要用水稀释需要多少RNA才能达到23的CQ值。进行倒入RT-qPCR后,用于对更浓缩的样品进行最终稀释,以计算CQ的最终稀释量为23.296的新目标值。RNA样品之间的冻结循环的数量保持不变。
在上一节中标准化的RNA用于使用蚊子X1 HV机器人液体处理程序(SPT LabTech)制作体积混合阵列(最终体积为10 µL)。对于每个病毒谱系和两个方向,制成了5:95、10:90、20:80、60:40和50:50的成对混合物。使五个测试菌株中的每一个相等的混合物(20%)。制备了25%的混合物和33%的混合物,以制备一部分可能的组合和对照组合100:0。有关完整的数组,请参见扩展数据表1。使用每个纯病毒谱系样品的最终测量的CQ值进行了校正的每个病毒谱系分数的估计值,以控制稀释步骤中遇到的问题(重复CQ测量的变化系数为0.007;扩展数据表2)。在所有95种混合物中,我们观察到一个0.016的变化系数。由于使用测量的CQ值控制了初始病毒浓度,因此我们期望剩余的谱系特异性偏置(扩展数据图3)可能是由于在混合物创建过程中遇到的实验不一致所致。
使用尖峰混合物的子集(每种类型的混合物中的一种,总共95种混合物)用于比较Freyja34,Cojac(使用公共Cojac Github存储库中的VOC定义;谱系A和Epsilon定义是由Kallisto创建的),来自Baiaijens等人的基于Kallisto的方法。Kallisto使用10个内核(没有引导)运行,LCS使用16个内核运行,均在Intel Xeon处理器(2.2 GHz)上运行。LCS运行48小时,但未能完成。使用“时间”命令执行时间安排,并在对齐,修剪和排序后包括所有步骤。时间对应于总CPU时间。
通过确定最大的互相关的转移来进行废水的流行病学曲线之间的滞后时间和对圣地亚哥Epsilon变体的临床监测的估计。对于废水和临床数据,包括在检测频率初始峰值之前的所有时间点。
使用IQTREE35,对所有SARS-COV-2 VOC基因组进行了重建,对所有SARS-COV-2 VOC基因组进行了10倍(10次读取或每个站点)的基因组覆盖率,覆盖率超过95%,质量得分超过20个,从UCSD校园采样(使用IQTree35)获得了20个以上的质量评分。该分析包括150个(112个临床和38次废水),49(37个临床和12个废水)alpha,以及来自UCSD的Delta谱系基因组160(136个临床和24个废水),除了20 60 epsilon,20 Alpha和39 Delta随机选择的基因。我们使用IVAR20来识别所有圣地亚哥样本的共识序列。仅当位点有共有基础(超过50%的核苷酸频率)时,仅在序列中包括碱基。我们还在树重建之前掩盖了已知的同质站点36。对时间比较的分析进行了608个样本(包括443个临床和165个废水,所有谱系)的分析,10×基因组覆盖率超过95%,质量得分为20。计算样品收集SNP距离,而无需考虑模棱两可的基础和间隙。
从图5中报道的样品和扩展数据中检索序列的实验以及阳性(阳性对照)(对哺乳动物细胞的已知SARS-COV-2谱系对照以及废水中的热灭活的SARS-COV-2病毒颗粒)和阴性对照组和阴性对照组和阴性对照组。将实验重复两次,以进行207个废水样品。所有复制尝试都是成功的。对于图2中报道的尖峰数据和图3的扩展数据,重复使用20个重复的临床样品中的谱系A尖峰A的提取和RT – QPCR,以检查整体测定变异性(报告了扩展的数据表2)。
有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。