幻灯片标签可实现单核条形码用于多模式的空间基因组学

健康作者 / 姓名 / 2025-06-24 22:02

　　小鼠在12 h – 12 h的灯光周期内进行集体室，并允许在抵达后2周适应其住房环境。大研究所涉及动物的所有程序均根据美国国立

　　小鼠在12 h – 12 h的灯光周期内进行集体室，并允许在抵达后2周适应其住房环境。大研究所涉及动物的所有程序均根据美国国立卫生研究院指南，指导和使用实验动物的护理和使用规程0120-09-16，并得到广泛的机构动物护理和使用委员会的批准。

　　在56天大的时候，通过在流动3％异氟烷的燃气室中给药1分钟，通过给予雄性C57BL/6J小鼠麻醉。通过检查负尾部的负反应来确认麻醉。动物被移动到解剖托盘，并在手术过程中通过鼻锥长时间通过3％异氟烷的鼻锥进行延长。使用含有110 mM NaCl，10 mM HEPES，25 mm葡萄糖，75 mM蔗糖，7.5 mM MGCL2和2.5 mM KCl的冰冷的pH 7.4 HEPES缓冲液进行心病灌注，以清除大脑和其他器官的血液。为了在区域组织解剖中使用，立即去除大脑并在液氮蒸气中冷冻3分钟，然后移动至-80°C以进行长期存储。

　　在E14处的整个C57BL/6J小鼠胚胎（MF-104-14-SER）购自Zyagen，并存储在-80°C下，直到使用为止。在收集和冻结整个胚胎之前，将怀孕的小鼠灌注PBS。

　　尸体尸检组织（Brodmann地区9皮层）来自一个健康，老年，女性，对照组，从米勒医学院的迈阿密大学脑捐赠银行获得。根据标准的患者知情同意程序收集了组织，该程序在收集时生效，并得到其机构审查委员会的批准或豁免确定。研究主题保护项目NHSR-4235批准了Broad Institute的组织使用。将该皮质样品存储在-80°C下，直到在低温恒温器中-20°C平衡后使用。作为质量控制步骤，在20 µm冷冻切片后通过NISSL染色评估组织结构，并使用TRIZOL提取，然后使用Agilent RNA Nano Nano Nano 6000 BioAnalyzer方法（RIN = 7.2）确定RNA完整性。

　　匿名过量的组织标本是从接受扁桃体扁桃体切除术的患者那里获得的。样品嵌入了OCT，frozen中，并存储在-80°C下。作为质量控制步骤，使用H＆E染色评估了组织结构，并使用TapSestation RNA屏幕板系统（RINE> 7.5）确定RNA完整性。研究主题保护项目IRB-6429批准了Broad Institute的组织使用。

　　在开始PD-1抑制剂之前，从接受腋窝淋巴结清扫术的患者中获取样品。样品被嵌入OCT中，手术后的快速冻结，并存储在-80°C下。研究主题保护项目NHSR-4182批准了Broad Institute的组织使用。

　　对于使用NISSL染色的部分，将玻璃安装的冷冻组织切片（10或20 µm）平衡至室温，并擦除过量的冷凝水。将切片固定在70％乙醇中2分钟，然后在超纯水中补液30 s。将多余的水擦掉，并用Arcturus组合溶液（Thermo Fisher Scientific，12241-05）染色4分钟。挖出了多余的染料，并将载玻片在水中补充10 s，以使其脱落。载玻片在70％，90％和100％乙醇中依次固定30 s，10 s和1分钟，在二甲苯溶液中固定后固定1分钟，然后用Fisher Chemical Permount（SP15-100）安装并盖上盖上覆盖。在尼康Apo×10物镜下使用Keyence BZ-800X显微镜或Leica Aperio versa Brightfield，荧光和FISH数字病理学扫描仪以×10目标的形式获取图像。

　　For sections that were stained using H&E, glass-mounted frozen tissue sections (10 or 20 µm) were equilibrated to room temperature and the excess condensate was wiped off. Sections were dipped in xylene, processed through a graded ethanol series and stained with haematoxylin. The nuclei were ‘blued’ by treatment with a weakly alkaline solution, and washed with water. Sections were stained with eosin, processed through a graded ethanol series, xylene, dehydrated and cover-slipped. Bright-field images were taken using the Leica Aperio VERSA Brightfield, Fluorescence & FISH Digital Pathology Scanner under a ×10 objective.

　　PLRP-S resin (1,000 Å, 10 μm; Agilent Technologies, PL1412-4102) was used for the barcoded oligonucleotide synthesis. The loading of the non-cleavable linker on resin was adjusted to approximately 30 µmol g−1. The Akta OligoPilot 10 oligonucleotide synthesizer was used for synthesis (850 mg scale). The PC linker (10-4920-90) and reverse phosphoramidites (10-0001, 10-9201, 10-0301 and 10-5101-10) were purchased from Glen Research. A 0.1 M solution of phosphoramidites was prepared in anhydrous acetonitrile, and 0.3 M BMT (BI0166-1005, Sigma-Aldrich) was used as an activator for coupling (single coupling, 6 min). Two capping steps (before and after oxidation) were performed with the cap A (BI0224-0505, Sigma-Aldrich) and cap B (B1:B2 1:1; BI0347-0505, BI0349-0505 Sigma-Aldrich) reagents. For the 6.3 ml column, capping was performed by 1 CV or 1.5 CV for 1 min; and, for the 1.2 ml column, 2 CV for 0.5 min. The oxidation (5 equiv) was performed with 0.05 M iodine in pyridine (BI0424-1005, Sigma-Aldrich). The detritylation step was performed using 3% dichloroacetic acid in toluene (BI0832-2505, Sigma-Aldrich).

　　寡核苷酸合成后，通过将树脂在室温下（每2毫升20 mg树脂）中孵育40％甲胺中的40％甲胺水（20 mg树脂）来去除保护基。用水（1 mL）两次用甲醇（1毫升），用1：1乙腈洗涤两次珠子：水：三次，用乙腈（1 mL）洗涤三次。最后，将珠子用10 mM Tris缓冲液pH 7.5洗涤3次，其中包含0.01％Tween-20，并在4°C下储存在相同的缓冲液中。据观察，如果将珠子储存长时间，则在缓冲液中释放了寡聚。为了去除释放的寡核，用70％的乙腈/水洗涤珠子，并重悬于储存缓冲液中。

　　幻灯片标签实验的合成序列（序列中的PC表示光透明接头）如下：（1）通过连接结合捕获序列：BOLD碱基表示与10X凝胶珠（SLAC Beads）（SLAC Beads）互补的区域：5′-TTT_PC_zCCGGTAATACGACTCACTATAGGGCTACACGACGCTCTTCCGATCTJJJJJJJJTCTTCAGCGTTCCCGAGAJJJJJJJNNNNNNNVVGCTCGGACACATGGGCG-3’, 10x FB1 extension:5'-gagctttgctaacggtcgaggctttaaggccggtcggtcctagcaa-3'，夹板：3'-CTGTGTGTGTACCCGCCTCGAAACGATTGC-5';(2) Direct synthesis of capture sequence on beads (TAGS beads): 5′-TTT-PC-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTJJJJJJJJTCTTCAGCGTTCCCGAGAJJJJJJJNNNNNNNVVGCTTTAAGGCCGGTCCTAGCAA-3’;(3) poly(A) beads: 5′-TTT-PC-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTJJJJJJJJTCTTCAGCGTTCCCGAGAJJJJJJJNNNNNNNVVA30.

　　如前所述进行阵列制备和测序20。

　　在-16°C下，将新鲜的冷冻组织在低温恒温器（CM1950，Leica）上冷冻截面为20μm。使用预冷的2毫米圆形（3331p/25，Integra），3毫米圆形（3332p/25，Integra）或5.5 mm正方形的定制活检打孔器来分离感兴趣的区域与组织切片。然后将打孔的组织区域放在冰球上，以确保没有褶皱。将手指放在冰球的底部，以融化组织，同时试图防止滚动。立即将该冰球放在玻璃载玻片上并放在冰上，将6-10 µL的解离缓冲液（82 mm Na2so4，30 mm K2SO4，10 mm葡萄糖，10 mm HEPES，5 mm MGCL2）放在冰球的顶部，以使缓冲区覆盖整个冰球。然后将冰球放在紫外线（365 nm）的光源（0.42 mW mm-2，Thorlabs，M365LP1-C5，Thorlabs，Ledd1b）中30 s（标签珠）或3分钟（SLAC珠），以相同数量的空间Barcode oligodode oligodode oligonuceletides nige oferigheatial barcode oligonuceletides reg.2 nike of。照片切割后，将冰球孵育7.5分钟（标签珠）或5分钟（SLAC珠），然后放入12孔板中（Corning，3512）。使用200 µl移液器，将10μl的提取缓冲液等分试样（解离缓冲液，1％Kollidon VA64，1％Triton X-100，0.01％BSA，666 U ML-1 ML-1 RNase抑制剂（BioSearch Technologies，30281-1-1））被散发到餐饮上的餐饮量为2 ml。在冰球上上下分配的提取缓冲液10-15倍以释放组织。重复此步骤，直到将组织完全从冰球上取出为止。除去冰球，并使用1 ml移液管进行上清液的机械解离，以20-25倍的三次三倍进行全面解离组织。从井中取出解离的核，并用1 ml洗涤缓冲液（82 mM Na2SO4、30 mm K2SO4、10 mM葡萄糖，10 mM HEPES，10 mM HEPES，5 mM MGCL2、50 µL RNase抑制剂（BioSearch Technologies）（BioSearch技术，30281-1），将井冲洗两次。添加到核悬浮核中。将洗涤缓冲液添加到管中，最终体积为20毫升。将20毫升混合并平均分为另外50毫升猎鹰管。将细胞核在4°C下以600g的600g离心在预冷的摇摆桶中离心10分钟。离心后，除去了19.5 mL上清液，每根管中留下500μl。颗粒重悬于并汇总。然后使用预冷的40 µM细胞过滤器（Corning，431750）过滤该合并的悬浮液。将DAPI（Thermo Fisher Scientific，62248）以1：1,000稀释液添加到过滤溶液中，并在4°C下孵育5-7分钟。然后将其在4°C下以200克离心10分钟。去除上清液，留下50μl的沉淀。重悬于沉淀物，并使用C-Chip Fuchs-Rosenthal一次性性血细胞计（Incyto，DHC-F01-5）手动计数核。

　　对于幻灯片标签SNRNA-SEQ实验，使用铬铬下一个GEM单细胞3'KIT v3.1（10x Genomics，PN-1000268），将43.3 µL计数的核加载到10倍基因组铬控制器中。根据制造商的建议，使用了带有特征条形蛋白CG000317的特征条形码技术的铬颗粒单细胞3'试剂盒v3.1（双指数）（双指数），并进行了轻微的修改。空间条形码库是作为细胞表面蛋白库制剂制备的。用于5.5×5.5 mm标签阵列的细胞表面蛋白库制备中的索引PCR步骤的PCR循环数为7;对于3毫米直径标签阵列，循环数为9。

　　对于小鼠脑样品，将冰球（请参阅“条形码珠合成，阵列制造和测序”部分中的序列）用于空间条形码。For this sample, a custom PCR protocol was used instead of step 4.1: 10 μl of cleaned supernatant from step 2.3, 50 µl NEBNext High-Fidelity 2× PCR Master Mix (NEB, M0541S), 2.5 µl STAG_P701_NEX (10 μM), 2.5 µl 10 μM P5-Truseq Hybrid oligo and 35 µl ultrapureDNase/RNase无蒸馏水（Invitrogen，10977015）。在此样本中，根据制造商的建议进行了十个PCR周期。

　　对于幻灯片标签多组分SNATAC-SEQ和SNRNA-SEQ实验，使用铬铬铬铬单细胞多组Multiome ATAC +基因表达式束（10x基因组，PN-1000283），将43.3 µL计数的核加载到10X基因组铬控制器中。根据制造商的建议，使用了铬的下一个GEM单细胞多组ATAC +基因表达CG000338 REV F用户指南，并进行了轻微的修改。在步骤4.1期间，加入了1μl0.329μm峰值引物（5'-GTGACTGGAGTTCAGACGT-3'）。对于空间条形码库，使用了自定义PCR协议：步骤4.3，50 µl NEBNEXT高效率2×PCR主混合（NEB，M0541S），2.5 µL10μMSTAG_IP7_A1寡头型，从步骤4.3，50 µL NEBNEXT高效率高效率2×PCR高效率2×）使用自定义PCR协议。（5'-caagcagaagagaggcataCgagatAttTAccgCagtGactGactggagtTcagAcgt*g*t-3'），2.5 µl10μm10μmP5-Stag_ip5_a1 oligo（5'-aatgatacggcgaccaCCACCACCACGACAATAAATAAAGACACTCTTTCCTCCTACACGACGC*T*C-3'），40 µL超纯DNase/RNase无蒸馏水（Invitrogen，Invitrogen，109777015）。在此样本中，根据铬中使用的协议进行15个PCR循环，其中包括用于细胞表面蛋白CG000317 REV C用户指南的特征条形码技术的Shex GEM单细胞3'试剂试剂盒v3.1 v3.1（双指数）。

　　如前所述44，我们从幻灯片标签多组cDNA中富集了TCR（https://www.protocols.io/view/slide-tcr-seq-v3-v3-ivt-n92ldp6w8l5b/v2）一下。

　　我们使用P2 100循环试剂盒对Illumina NextSeq 1000仪器上的SCRNA-SEQ和空间条形码库进行了测序（Illumina，20046811）。对于某些库，使用S Prime平台在Illumina Novaseq仪器上进行了重新方程以改善测序深度。

　　我们使用Cell Ranger（v.6.1.2）1 MKFASTQ（10X基因组学）从RAW测序读取中生成反复插曲的FastQ文件。我们将这些读取与人类GRCH38或小鼠MM10基因组保持一致，同时使用内含子读取 - 含义 - 含义 - 使用细胞ranger计数（10x基因组学）将基因计数为UMIS。对于小鼠胚胎，人脑，扁桃体和黑色素瘤，我们使用Cellbender v.0.2.0进行背景噪声校正和单元调用61，设置 - 指向细胞ranger细胞呼叫的数量，即滴滴 - 滴滴 - 包括40,000和 - 级别的率率为0.00005（仅在probity tefeption comparece）的范围内（包括均值范围）。

　　我们使用Cell Ranger-ARC（V.2.0.2）MKFASTQ（10X基因组学）从RAW测序读取中生成反复插图的FastQ文件。我们将这些读取与人类GRCH38基因组保持一致，并使用细胞Ranger-ARC计数（10x基因组学）将基因量化为UMIS。对于基因表达数据，我们随后使用Cellbender进行背景噪声校正和细胞调用，如上所述。

　　创建了删除的FastQ文件后，我们使用GREP搜索了包含空间条形码通用引物常数序列的读数。然后，我们使用seqtk v.1.3-r106将含空间条形码的FastQ文件删除为2500万次读取，以获得跨运行的计算效率和一致性。然后，我们将空间条形码FASTQ文件中的候选细胞条形码与从单元格游舱v.6.1.2或Cellbender61（补充表14）输出的真实细胞条形码（补充表14）匹配，从而生成候选空间条形码序列的数据框架。从这个数据框架中，我们将候选空间条形码序列与原位测序的空间条形码匹配，分配每个真实的空间条形码一个空间坐标。

　　Slide-tags nuclei are assigned x,y coordinates corresponding to the distribution of spatial barcodes per nucleus (Supplementary Fig. 1). First, snRNA-seq or multiome data are preprocessed as described above to generate a gene-by-cell-barcode count matrix. The whitelist of cell barcodes from Cell Ranger and spatial barcodes from in situ bead array sequencing are matched in the spatial barcode FASTQ to generate a spatial-barcode-by-cell-barcode matrix. Spatial barcodes with outlier UMI counts (that is, UMI > 256) are removed as these probably represent beads dislodged from the glass slide during nucleus isolation and encapsulated in droplets with nuclei (data not shown). Then, taking the set of spatial barcodes and their x,y coordinates for each cell barcode, DBSCAN62,63 (v.1.1−11) is used to filter out noise spatial barcodes before spatial positioning of nuclei (Supplementary Fig. 1c). DBSCAN outputs a cluster assignment for each spatial barcode. Cluster = 0 corresponds to noise spatial barcodes without a clear spatial distribution, and cluster of numbers greater than zero correspond to signal spatial barcodes with discrete spatial clustering. We did not assign spatial positions to nuclei with all spatial barcodes denoted noise, or to nuclei with multiple signal clusters. From the remaining nuclei with one distinct spatial barcode signal cluster, we filtered out noise spatial barcodes and computed a UMI-weighted centroid of spatial barcode coordinates in the signal cluster. DBSCAN required two parameters as input: minPts and eps. To determine the optimal parameter set for each Slide-tags run, we iterated through minPts parameters from minPts = 3 to minPts = 15 under a constant eps = 50 and chose the parameter set with the highest proportion of nuclei that are assigned a spatial position (a single DBSCAN signal cluster). Sankey plots were generated using Sankeymatic (https://sankeymatic.com/).

　　使用MixCR（V.4.1.0）64,65鉴定TCR序列，并使用锤距1塌陷分配给细胞条形码。

　　使用seurat（v.4.3.0）21读取Cell Ranger生成的输出。过滤步骤在补充图1B中进行了量化。我们将每个核的总UMIS归一化为10,000（CP10K），并将这些值转换为将基因表达报告为E = log [cp10k+1]。使用方差稳定转化校正后，我们确定了前2,000个高度可变的基因66。所有基因表达值均缩放并中心。为了在两个维度中可视化，我们使用前30个主组件将核嵌入UMAP67中，邻居数= 40，min_dist = 0.3，sprave = 15，局部连接= 12和余弦距离度量。我们使用前30个主要组件确定了共享的邻居。使用Louvain方法检测到类似细胞的簇，使用Findclusters实施，分辨率= 0.8。然后，使用FindTransferanchor，然后将TransferData分配给每个单元格，基于对小鼠成人脑参考数据集的映射，并在两种情况下都具有前25个主要成分。对于每个计算的细胞群集，使用最高比例的转移标签分配了身份，并使用已知标记基因确认。

　　我们测量了与小鼠海马数据集中高质量映射的细胞相对应的839个细胞条形码的空间定位的准确性（图1）。对于这些单元格，我们使用了属于DBSCan Singlet群集的空间条形码，并使用以下方式计算了X和Y坐标的标准误差：

　　其中n是群集中的空间条形码UMI的数量，而σ是S.D.来自簇的质心的每个空间条形码UMI。

　　除S.E.外，还计算了每个DBSCAN SINGLET群集的其他指标。也就是说，空间条形码与质心的几何平均距离：

　　其中n是簇中的空间条形码UMI的数量，而Xi -c是每个空间条形码UMI和簇质心之间的绝对距离。

　　对于只有一个DBSCAN群集的每个单元，计算了其他指标（扩展数据图2D – G）。计算了独特的空间条形码序列的总数以及与每个单元相关联的空间条形码UMIS的总数，无论它是否在Singlet DBSCAN群集中。然后计算出DBSCAN单线簇内外的空间条形码UMI的比例为每个单元的信号空间条形码的比例。

　　使用NISSL染色并成像，对剖面区域的串行部分进行了染色。使用MATLAB中的流域分割对细胞进行分割（释放2021b），并计算每个段的质心。接下来，将这些坐标读取为R，并使用DBSCAN隔离属于CA1区域的细胞，并带有以下参数：EPS = 35，MINPTS = 20。裁剪图像区域以匹配剖面幻灯片标签区域的图像区域。对于两个数据集，通过这些点拟合了十阶（NISSL）或第九阶（幻灯片标签）线性模型，从而生成中央曲线。对于每个空间条形码UMI，确定了欧几里得空间中此曲线的最近邻居，并将与这两个点的距离记录为距拟合线的距离。

　　属于CA1簇的核是子集，在使用方差稳定转化校正校正后，鉴定出该子核中的前1,000个高度可变基因66。使用这些可变基因进行主成分分析（PCA）。我们使用前25个主要组件确定了共享的邻居。使用louvain方法检测到使用Findclusters实施的社区检测方法检测到相似细胞的簇，分辨率= 0.5。使用带有默认参数的Findmarker鉴定了两个簇之间的差异表达基因。使用先前鉴定的基因表达标记为68,69，将子层标签分配给每个群集。从Allen小鼠脑Atlas23获得了与比较图的原位杂交数据。

　　对于每个样品，如上所述运行细胞游侠，并通过单元格Ranger Aggr（v6.1.2）运行输出，以说明每个单元格的测序深度的差异。结果是一个25,158个核的组合基质，每个细胞的平均读数为25,107个，每个细胞中位2,309个中位数UMIS和每个细胞中位基因的中位基因。然后，使用seurat（v.4.3.0）21读取由单元格ranger生成的过滤特征 - barcode矩阵。我们将每个核的总UMIS归一化为10,000（CP10K），并将这些值转换为将基因表达报告为E = log [cp10k+1]。使用方差稳定转化校正后，我们确定了前2,000个高度可变的基因66。所有基因表达值均缩放并中心。为了在两个维度中可视化，我们使用前40个主组件将核嵌入UMAP67中，邻居数= 40，min_dist = 0.3，spread = 15，局部连接= 12和余弦距离度量。我们使用前40个主要组件确定了共享的邻居。使用Louvain方法检测相似细胞的簇，使用FindClusters实施，分辨率= 1。然后分配了一个预测的身份，基于映射到小鼠成人大脑参考数据集的映射使用FindTransferanchors，然后使用TransferData，然后在两种情况下都是前25个主要成分。然后将这些细胞类型指定用于对比分析。从分析中除去了指定UNK_1或UNK_2的细胞，因为这些细胞显示出低质量指标，并且不是可解释的标签。

　　为了将幻灯片标签SNRNA-Seq和Slide-Seq的捕获与散装RNA-Seq数据进行比较，我们使用了以前发表的小鼠脑的散装RNA-Seq数据集9。为了生成此数据集，使用了滞留的mRNA Truseq试剂盒（Illumina，20020594），从解剖的矢状小鼠海马中制备链的poly（a）选择库。对库进行测序，并使用与STAR71对齐后的RSEM70对每个基因生成每百万（TPM）的转录本。对于幻灯片数据，我们使用了两个先前发布的数据集：slide-seqv1（参考9）puck_180819_6和slide-seqv2（参考20）puck_200115_08。平均TPM（APTM）是通过将冰球上所有珠子的每个基因的计数求和除以冰球上的所有UMIS的总和，而是除以100万（总数/100万）。为了进行适当的比较，为了进行适当的比较，量化数据以排除内含子读数。然后，通过在图1G – I中使用的所有核中的每个基因的计数来求和，然后将APTM分开，除以所有UMIS在所有核中的总和，然后除以100万（总数计数/100万）。绘制了这些值的每个值（Bulk TPM和幻灯片ATPM）的每个基因分布，并进行线性回归以计算Pearson的相关系数。

　　将幻灯片标签SNRNA-SEQ小鼠海马数据与幻灯片seqV2（参考文献20）小鼠脑数据和DBIT-SEQ小鼠脑数据（空间-ATAC-RNA-SEQ13）进行了比较。对于基因和UMI计数比较，将幻灯片数据的数据空间归为20μm空间平方像素。如上所述，处理幻灯片标签SNRNA-SEQ数据，并将核嵌入UMAP空间中。每个空间斑点（幻灯片seqv2中的10μm珠）的幻灯片seqV2和DBIT-SEQ总umis归一化为10,000（CP10K），并进行对数转换以报告基因表达为E = log = log [cp10k+1]。使用方差稳定转化校正后，可以鉴定出前2,000个高度可变的基因66。将基因表达值缩放并中心。为了在两个维度中可视化，我们使用前30个主组件嵌入了UMAP空间中的空间斑点，邻居数= 30，min_dist = 0.3，shive = 1，局部连接= 1和余弦距离度量。我们使用前30个主要组件确定了共享的邻居。对于幻灯片seqV2，使用使用FindClusters实施的Louvain方法检测到相似细胞的簇，分辨率=1。来自空间-ATAC-ATAC-ATAC-RNA-SEQ PUBLICATION13的RNA簇13用于DBIT-SEQ数据。使用Seurat中的肘部绘制了前30个主要组件的标准偏差。点图显示了从空间-ATAC – RNA-Seq出版物中的DBIT-SEQ的SCTRANSFORFERFERS表达值。

　　使用seurat（v.4.3.0）21读取Cell Ranger生成的输出。我们将每个核的总UMIS归一化为10,000（CP10K），并将这些值转换为将基因表达报告为E = log [cp10k+1]。使用方差稳定转化校正后，我们确定了前2,000个高度可变的基因66。所有基因表达值均缩放并中心。为了在两个维度中可视化，我们使用前30个主组件将核嵌入UMAP67中，邻居数= 40，min_dist = 0.3，sprave = 15，局部连接= 12和余弦距离度量。我们使用前30个主要组件确定了共享的邻居。使用Louvain方法检测到类似细胞的簇，使用Findclusters实施，分辨率= 0.8。然后，使用FindTransferanchor，然后将每个单元格基于在E14参考DataSet18上映射到E14参考数据集的鼠标，然后转移DATA的预测身份，在两种情况下，前25个主要组件。对于每个计算的细胞群集，使用最高比例的转移标签分配了身份，并使用已知标记基因确认。

　　通过Cellbender过滤细胞Ranger产生的输出，并读取为R（V.4.2.2）。将矩阵取下到完全具有一个DBSCAN位置和不到5％的线粒体UMIS的单元格，然后将其加载到Seurat中（v.4.3.0）21 21以执行归一化，查找可变特征，缩放特征，PCA，查找邻居（DIMS = 30）（dims = 30）（dims = 30）并与Default Parameters（否则）（否则创建umap commitife）（除非否则）（除非default Parameters）（否则）。通过绘制UMAP上的规范细胞类型标记基因并手动为每个群集分配一个细胞类型，将每个簇分配一个细胞类（兴奋性神经元，抑制神经元，少突胶质细胞，OPC，Astroce，内皮细胞，小胶质细胞）。随后，使用Harmony v.0.1.1的标签传输从已发表的人类皮质数据集中映射兴奋性和抑制性神经元亚型，并在补充无花果中绘制空间绘制。2b和3b。

　　每个单元格（L1-2，L3-5，L6，WM）的层分配是通过手动绘制特定层特异性映射神经元亚型的边界来计算的，并根据其之间的两个边界分配每个单元格。然后，通过将每个单元格到最近的边界的欧几里得距离并将其除以两个相邻边界的距离的总和来计算数值层流坐标，并将其除去两个相邻边界，从而取决于层分配的恒定因子。

　　在计算每个基因的空间变异评分之前，如果核对不同细胞类型的标记基因的z得分含有高于2的表达，则除去核。随后，通过使用统一的内核沿滤波细胞的层流坐标计算基因表达的内核密度，并在最高表达密度和最低表达密度之间差异（补充表2），将每个基因分配了空间变化评分。通过获取每种细胞类型的空间可变基因列表的交点，发现复杂的梯度，并在图2L中显示了一个视觉上选择的有趣子集。

　　使用来自ClusterProfiler v.4.6.0（使用默认参数）的浓度（使用默认参数）的所有基因进行了基因本体分析，并在生物学过程中使用org.hs..db v.3.16.0（补充表3）的注释。对于图2K中的显示，将术语进一步征用，仅包括padj的术语< 1 × 10−8 in at least one cell type.

　　Genes with a spatial variation Z score above 10 in excitatory/inhibitory neurons and above 8 in astrocytes/OPCs are shown in the heat maps in Fig. 2i,j and Extended Data Fig. 6d,e. Genes that additionally had a minimum expression below 0.8 were spatially plotted in Supplementary Fig. 4–6.

　　The percentage of high-quality nuclei that were spatially positioned and the density of mapped nuclei were compared across four human cortex Slide-tags runs (Supplementary Table 4). For each run, the cell calls generated as output by Cell Ranger were used and low-quality cells were removed if they belonged to a cluster with an average mitochondrial nUMIs percentage of greater than 5%. Then, the percentage of mapped nuclei was computed by dividing the number of nuclei with exactly one DBSCAN location by the total number of nuclei. The nucleus density was calculated by selecting a window of tissue with equal white and grey matter area and dividing the number of spatially positioned nuclei in the window by the window area.

　　The output generated by Cell Ranger and filtered by CellBender was read into R (v.4.1.1) using Seurat (v.4.3.0)21. We normalized the total UMIs per nucleus to 10,000 (CP10K) and log-transformed these values to report gene expression as E = log[CP10K + 1]. We identified the top 2,000 highly variable genes after using variance-stabilizing transformation correction66. All gene expression values were scaled and centred. For visualization in two dimensions, we embedded nuclei in a UMAP67 using the top 30 principal components, with number of neighbours =30, min_dist = 0.3, spread =1, local connectivity = 1 and the cosine distance metric. We identified shared nearest neighbours using the top 30 principal components. Clusters of similar cells were detected using the Louvain method for community detection, implemented using FindClusters, with resolution = 1. Annotation of de novo clusters was aided by marker genes and Azumith21 reference-based mapping from the human tonsil atlas72.

　　Significantly non-random genes were discovered in GCB cells as described previously9. In brief, for each single-nucleus assigned as a germinal centre B cell that was positioned in one of the four largest germinal centres that we profiled, we first calculated the matrix of pairwise Euclidean distances between cells for each germinal centre individually. We then compared the distribution of pairwise distances between the cells expressing at least one count of that transcript to the distribution of pairwise distances between an identical number of cells, sampled randomly from all mapped beads within the set with probability proportional to the total number of UMIs per cell. Specifically, we generated 1,000 such random samples, and for each sample calculated the distribution of pairwise distances. We then calculated the average distribution of pairwise distances, averaged across all 1,000 samples. Finally, we calculated the L1 norm between the distribution of pairwise distances for the true sample of cells and the average distribution. We defined p to be the fraction of random samples with distributions closer to the average distribution (under the L1 norm) than the true sample. We calculated an Z score for the true sample given the distribution distances from the average distribution of random samples. Finally, we aggregated p values for spatial variation from each of the four tested germinal centres using Fisher’s method.

　　We intersected our computed spatially varying genes with genes that were previously implicated in germinal centre zone distinction73. We calculated the percentage variance in gene expression space and plotted it against the spatial effect size from our spatial permutation test to identify genes with relatively low gene expression variance but high spatial variance.

　　We used spatially varying genes (P < 0.05) identified as described above to classify GCB cells into light-zone, dark-zone and transitional states. Specifically, we subsetted our data to GCB cells, rescaled and recentred values, and ran PCA on the 1,068 significant spatially varying genes. We then identified shared nearest neighbours using the top 15 principal components. Clusters of similar cells were detected using the Louvain method for community detection, implemented using FindClusters, with resolution = 0.4. We annotated clusters as light-zone, dark-zone and transitional states using marker genes and Azumith21 reference-based mapping from the human tonsil atlas72.

　　After classifying GCB cells into states, we spatially segmented germinal centres into light zones and dark zones using dark-zone B cell spatial density. We ran DBSCAN62 on dark-zone B cells of the two largest germinal centres, using eps = 60 and minPts = 6 for the largest germinal centre, and eps = 60 and minPts = 10 for the second-largest germinal centre. We considered cells within the top DBSCAN cluster to constitute the dark zone and segmented around the outer cells. The remaining cells in both germinal centres were considered to be in the light zone and segmentation borders were drawn accordingly. We tested for zone bias of T follicular helper cells and follicular dendritic cells using chisq.test from the stats package in R (v.4.2.2).

　　To detect receptor–ligand interactions between cell type pairs, we computed a receptor–ligand score based on a spatial correlation index74, SCI, which we defined as:

　　between N cells of ‘sender cell type’ expressing receptor r and M cells of ‘receiver cell type’ expressing ligand l, where expression is sctransform counts75. We defined the spatial weights matrix of dimensionality N × M as an adjacency matrix, denoting 1 for when sender cell i is within 100 μm of receiver cell j and 0 otherwise. We first ran LIANA33 (v.0.1.12) to generate a putative list of receptor–ligand interactions between cell type pairs in a spatial agnostic manner, filtering to receptor–ligand interactions that are expressed in at least 50 cells of sender and receiver cell types (log[CPM] >0），或在30％的发件人和接收器单元中。然后，我们为每个受体 - 配体相互作用计算了一个空间相关指数，以确定受体和配体是否在给定的细胞型对中为空间共表达。

　　为了确定受体 - 配体评分的空间意义，我们使用了适应性的空间排列测试，每种受体 - 配体相互作用进行1,000个排列。在每个排列中，我们将细胞类型中细胞的空间位置随机排列。对于与标称P值小于或等于0.005的相互作用，我们又进行了9,000个排列。我们使用Benjamini – Hochberg程序纠正了多种假设测试。我们还计算了观察到的SCI统计量与经验无效分布的中位数SCI统计量之间的对数转换FC。这使我们能够在不同的单元格类型的受体与配体相互作用之间比较Sci log转换的FC值，而无需明确纠正每种细胞类型的细胞数量。

　　为了在空间上情境化受体 - 配体相互作用，我们将GCB细胞，T卵泡辅助细胞和卵泡树突状细胞（PADJ <0.05）之间的每种显着相互作用分解为单个细胞的相互作用强度得分。这些分解的分数反映了每个单个单元对总空间相关指数的贡献，该指数的定义为接收单元I，反之亦然。

　　比较黑暗区域和光区之间每个细胞的受体的相互作用强度得分。我们使用Benjamini – Hochberg方法校正P值。在深色区域和光区之间使用Sctransformed表达值测试了区特异性受体表达。

　　通过Cellbender过滤细胞游侠的输出，并使用Seurat（V.4.3.0）21读取R（V.4.1.1）。我们将每个核的总UMIS归一化为10,000（CP10K），并将这些值转换为将基因表达报告为E = log [cp10k+1]。使用方差稳定转化校正后，我们确定了前2,000个高度可变的基因66。所有基因表达值均缩放并中心。为了在两个维度中可视化，我们使用前30个主组件将核嵌入UMAP67中，邻居数= 30，min_dist = 0.3，spread = 1，局部连接= 1和余弦距离度量。我们使用前30个主要组件确定了共享的邻居。使用Findcluster实施的Louvain方法检测到类似细胞的簇，分辨率=1。MarkerGenes帮助从头簇的注释。

　　使用seurat21读取由细胞游侠产生的RNA表达矩阵。使用Signac（v.1.9.0）77读取由Cell Ranger生成的ATAC过滤特征 - 巴尔代码矩阵读取为R（v.4.1.1），并在包含RNA表达计数的Seurat对象中添加为其自己的测定插槽。使用Callpeaks函数召回了峰，该功能在所有单元格中使用Macs2（V.2.2.7.1）78。将片段映射到MACS2称为的峰，并使用Signac中的特征函数分配给核。使用GenomeInfodB（V.1.35.15）79（v.1.35.15）79和HG38基因组的有问题的区域的峰值去除非标准染色体的峰，并使用subsetByoverLaps根据Githlist可用的subsetByoverLaps去除HG38基因组的峰值区域（https://github.com.com.com.com.com..com.com.com.com/boyle-lab-lab/blab/blist/blist-clast-clack/blist, listblistc.80-80然后将最终峰值矩阵添加到Seurat对象内的“峰”测定中。

　　对于细胞类型的注释，将来自多组实验的SNRNA-SEQ数据归一化，对于每个核的总UMIS至10,000（CP10K），并将对数转换报告为E = log = log [CP10K+1]。使用方差稳定转化校正后，可以鉴定出前2,000个高度可变的基因66。然后，我们使用SelectIntegrationFeatures，find IntegrationFeatures，Find Integrationancners和IntegratedAta与Seurat的默认参数（v.4.3.0）集成了来自Slide IntegrationFeatures，Find IntegrationFeatures和IntegratedAta的基因表达数据的基因表达数据与来自幻灯片标签的基因表达数据。将综合基因表达值缩放并中心。为了在两个维度中可视化，我们使用前30个主组件将核嵌入UMAP67中，邻居数= 30，min_dist = 0.3，spread = 1，局部连接= 1和余弦距离度量。我们使用前30个主要组件确定了共享的邻居。使用FindCluster实施的Louvain方法检测到相似细胞的簇，分辨率= 1。基于标记基因的分辨率= 1。来自幻灯片标签的细胞，并与幻灯片标签SNRNA-SEQ细胞共团长群集。如上所述，使用非集成对象进行了以上分析的对象，对幻灯片多组的基因表达计数进行了重新批准并聚会。

　　正如先前建议的（Trinity CTAT项目的渗透性; https://github.com/broadianstuttion unpercnv offercnv），使用了从标准SNRNA-SEQ数据中推断出大规模CNV的渗透率（V.1.3.3）（v.1.3.3）。从注释的Seurat对象中提取了经过细胞者校正的计数，其中正常参考细胞被指定为所有未标记为肿瘤的细胞。在以下参数下运行渗透量：cutoff = 0.1，cluster_by_groups = t，denoise = t，hmm = t，num_threads = 60。

　　TCR分析集中在CD8+ T细胞上；我们使用Fisher的精确测试来测试（1）与所有具有分析的β-链的CD8+ T细胞相比，β-链序列casrasneqff是否偏向于肿瘤室，其中肿瘤室分割是基于肿瘤亚群密度手动进行的；（2）将CD8+ T细胞与TCRα链Caewynqggklif和β链Casrasneqff配对是肿瘤室。

　　使用Signac和RunTFIDF和RunSVD函数在峰测定法上进行潜在的语义索引（LSI）。为了在两个维度中可视化，我们使用LSI维度2–30将核嵌入UMAP67中。使用构造的模态的组合以及加权最终的邻居分析，可视化细胞核。使用Seurat的Findmultimodalneighbors功能确定了多模式的邻居，RNA PCA尺寸为1:50，而ATAC LSI尺寸为2:50。然后，这些邻居被用作runumap的输入以进行可视化。

　　为了注释峰值中存在的主题，使用Jaspar 2020数据库中的所有人类基序来创建一个Motif Object的Signac函数createMotifObject。然后使用Signac的Runchromvar函数（Chromvar V.1.16.0）计算基元可访问性Z分数。使用Signac功能基因应力计算基因活性评分。我们通过将RNA分析（NGS）中位数NUMI的每个核的总基因得分标准化，并将对数转换这些值报告为E = log [ngs+1]。

　　使用Seurat81的Findmarkers实现的桅杆进行差异基因表达分析。分析比较了幻灯片标签SnRNA-Seq的肿瘤簇1和肿瘤簇2，并比较了使用幻灯片标签的隔室特异性CD8+ T细胞使用的多组数据，该数据使用的Min.pct = 0.25 = 0.25和log2fc.threshresht = 0.25。分析比较了使用的幻灯片标签的肿瘤簇1和肿瘤群集2使用的多组数据。基因本体生物学过程（go_biological_process_2021）基因集富集分析是在肿瘤簇2中使用R82,83,84中的富集套件（v.3.1）进行的，该肿瘤簇2富集差异表达的基因，该基因具有log2 [fc] <-0.5 <-0.5和padj <0.05。使用Min.pct = 0.1和log2fc.Threshold = 0的Seurat中实现的Wilcoxon Rank-SUM测试进行了差异染色质基因分析分析。

　　我们使用Seurat中的AddModulesCore在黑色素细胞样和间充质的特征上进行了肿瘤细胞，并具有适用于先前工作的基因列表46,85（补充表15）。使用Pearson的相关系数测试了Chromvar基序评分与间充质评分的相关性，并使用Benjamini -Hochberg程序校正P值。Chromvar基序的空间自相关使用R86中的APE软件包（v.5.6-2）的Moran.i进行了测试，其中权重矩阵指定为1/decort2。

　　有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

分享到

声明：本文为用户投稿或编译自英文资料，不代表本站观点和立场，转载时请务必注明文章作者和来源，不尊重原创的行为将受到本站的追责；转载稿件或作者投稿可能会经编辑修改或者补充，有异议可投诉至本站。

幻灯片标签可实现单核条形码用于多模式的空间基因组学

最新文章

热文导读