
使用先前描述的方法8,62进行样品制备,该方法与对雄性成年神经(MANC)VNC EM体积的研究中描述的相似。
从广州菌株G1×W1118之间的十字架中的五日大成年果蝇男性雄性雄性在12小时的夜间周期中抬高,并在开启灯后1.5小时解剖。与以前的工作的主要区别发生在此解剖步骤中。我们将整个中枢神经系统作为一个单元,包括大脑,VNC和颈部。需要进行许多尝试和极端护理的主要困难是在不损害相对脆弱的颈部连接的情况下进行剖析。为了重建整个中枢神经系统,需要一个未损坏的颈部连接。此处报告的视神经叶是此完整CNS重建的子集。将分离的CNS样品固定在2.5%甲醛和2.5%戊二醛中在0.06 m磷酸盐缓冲液中在pH 7.4时在22°C下2小时固定。洗涤后,将组织在0.5%四氧化os中固定在0.05 m的cacodylate缓冲液中40分钟,然后在4°C的缓冲液中用1%铁氰化钾处理2小时。洗涤后,将组织与0.5%乙酸乙酸盐孵育30分钟在4°C,然后在DDH2O中的1%四氧化盐中固定(第二次)30分钟。接下来是在4°C下过夜过夜的天冬氨酸铅。当组织转移至10%乙醇时,进行性降低温度脱水程序从1°C开始。温度逐渐降低至-25°C,而乙醇浓度逐渐升至97%。将组织在0.3%乙酸乙醇中在-25°C中孵育32小时。在进行性降低温度过程和低温孵育之后,温度升高至22°C,将组织冲洗在纯乙醇中,然后在纯乙醇中氧化丙烷,然后浸润并嵌入EPON(Poly/Bed 812; Luft公式)。用蝇样品处理了醛固定的20%BSA切入约1 mm立方体的BSA。然后将BSA立方切成小块(约0.1毫米) 最终渗透后。将苍蝇中枢神经系统嵌入1:1切碎的BSA中,并将纯树脂嵌入嵌入模具中。该切碎的BSA用作覆盖CNS样品的嵌入填充剂,以提高热刀片的质量。这些方法优化了形态保存,实现全脑部制备而不会失真并增加染色强度,从而促进了更快的聚焦离子束铣削和扫描电子显微镜(FIB-SEM)成像。通过X射线CT成像(Zeiss Xradia versa 510)检查每个完成的样品,以检查解剖损伤和其他潜在缺陷,并评估染色质量。在这项研究中记录的选定样本以内部名称为“ Z0720-07M”。
果蝇中枢神经系统大约宽700 µm,长度超过1,000 µm,这使得它太大而无法通过Fib-Sem映像而无需铣削伪像。因此,我们将大脑向右到左(图1A中所示的方向上的垂直切割)和VNC纵向(图1A的方向的水平切割),均使用半厚的板,使用半厚的板,使用半厚的板,它们在半纤维蛋白project8期间开发的方法。这使得在多个FIB-SEM成像机上并联单个平板的成像。在嵌入过程中,将CNS用垂直于块面VNC的长轴定向,其尾端最接近块面。然后将块修剪成Fin Shape64(宽600 µm,在切割方向上长几毫米,倾斜的后缘),到包含所有VNC和一半颈部的深度,使大脑在未修剪的部分中。然后使用先前描述的热刀超片截面程序64(油润滑钻石刀(硅藻25°角冷冻干燥),90°C刀固定点温度,0.05 mm s – 1)。然后将包含大脑和颈部上半部的块的其余部分重新定向并重新安装在Epon中,以使大脑的长轴垂直于新的块面。将该块修剪成鳍形,并将其热刀截面(切割速度为0.025 mm S – 1)成35台,每个平板厚20 µm。每个平板都是通过LM成像以进行质量控制的,然后将平面固定在坚固的背部膜上,粘在金属纤维-SEM安装片上,并使用先前描述的方法64进行激光调整。然后对每个安装的平板进行成像(0.67 µm像素尺寸),以检查制备质量,以提供针对Fib-Sem铣削的参考指南,并建立一个Z轴刻度系数以进行后续体积比对。所有66个平板均分别成像fib-sem, 并且所得的卷数据集被计算在一起(如“ EM量对齐”部分中),并用于整个CNS的持续重建。这些板中的13个板中包含正确的视神叶。
我们使用了一项描述MANC EM Volume63的研究的成像方法,并以最少的修改重现,以确保报告方法的一致性和准确性。
将近一年的七个定制的FIB-SEM系统对35个大脑和31个VNC平板进行了成像。与Hemibrain Project8使用的FIB-SEM机器不同,这个新平台用Zeiss Capella Fib柱代替了FEI Magnum Fib柱,以提高FIB铣削控制的精度和稳定性65。Fib铣削是由15 Na 30 kV Ga离子梁具有名义8 nm步长进行的。使用1.2 kV着陆能的3 Na梁以3 MHz的形式以8 nm XY像素大小以3 MHz的形式获取SEM图像。将样品接地在0 V处,以使二次和反向散射电子的收集。
将EM量与用于Hemibrain8的管道的更新版本对齐,该管道也用于MANC VNC卷63。“渲染” Web服务用于35个脑板的串行部分对齐,然后自动调整厚度变化66。使用手工工程67和基于机器学习的成本估算的组合自动识别板的表面63,67,然后使用基于BigDataviewer68的自定义工具进行手动修补,然后进行手动修补,以互动地纠正其余问题。与MANC和Hemibrain样品一样,然后使用定制的,分布式的方法将一系列扁平的平板缝合,用于大规模变形式注册,以说明在热刀分段期间引入的变形。开发了一种自定义的基于BigDataviewer的工具,可以在挑战区域进行交互帮助自动对齐过程。可以在GitHub(https://github.com/saalfeldlab/render)上找到用于渲染Web服务的代码,以及用于表面查找和热刀图像缝线的代码(https://github.com/saalfeldlab/hot-hot-knife)。
如MANC VNC体积63所述进行分割,但有一些差异。洪水填充网络(FFN)推断仅在可能包含可分割组织的区域应用。要检测到这些,我们使用了以下启发式:将Clahe归一化的图像降为32×32×32×32 nm3素体素尺寸,然后用高通滤波器IHP = I+min 3×3(255-i)过滤内面内(XY),在该量为IS 3×3(255 - i),IS IS INSIE量和分钟3×3×3×3×3×3×3×3×3×3×3×3的尺寸。3×3像素。然后,我们计算了以220值为220的过滤图像阈值的2D(平面内)连接的组件,并使用每个部分中最大的连接组件来将EM图像的相应部分排除在分割中。
我们通过将FFN分割的选定段分为八个分离类别来培训了体积的语义分割模型:DO-NOT-MERGE,GLIA,GLIA,气管,SOMA,非Glia – Nuclei – Nuclei-nuclei,Neuropil,Neuropil,suscle,suscle,suscle and Glia – Nuclei。我们使用这些训练卷积神经网络模型将数据集的每个体素以16×16×16 NM3分辨率分类为其中一种类别。然后,对于每个段,我们都使用多数投票方案计算了相应的类,并且仅包括集聚图中的SOMA,非Glia-Nuclei和Neuropil段。用于此过程的神经网络具有与FFN(残留对流)相同的架构,但是在“有效”模式下使用所有卷积层。
我们取决于语义分割模型的预测,而不是手动注释数据集中的所有核。我们计算了分类为神经胶质和非胶质 - 核中的体素的3D连接组件,并根据以下程序进行了两次后处理:应用形态侵蚀,半径为5个体素,重新计算3D连接的组件,然后卸下小于10,000 Voxels小于10,000 Voxels的组件。我们将其余物体的质心视为核中心,并禁止在聚集图中合并不同的核。我们采用了启发式程序来合并核段和周围的soma段。我们用5个体素的半径应用形态扩张,以在上一步中产生的每个核。接下来,我们在16×16×16 nm3的这些扩展的核和FFN段之间计算了至少10,000个体素之间的重叠体素的数量,其中多数soma或non-glia – nuclei。然后合并所有与特定核匹配的段。
我们使用MANC VNC重建63中描述的方法进行了突触预测。我们从较大的中枢神经系统样本中获得了地面真相突触数据,并将其用于训练网络以进行突触前T-BAR检测和突触后伴侣检测63。使用先前训练的检测器63初始化了用于T-BAR检测的网络权重,然后使用可用的CNS培训数据进行了微调。为了量化视觉叶中突触识别的性能,在视位叶体积中随机选择了14个立方体的300×300×300素,并密集注释每个子量的突触。这些子Volumes包含287个带注释的T-bar和2,425个注释后的突触伴侣。单独使用T-BAR的总体Precision-Recall图和突触作为单位(两个组件)的突触图1A显示。性能要比Hemibrain8中的准确性要好得多,并且与MANC重建的性能相似。63。
校对遵循的方法与为Hemibrain8和MANC63连接的记录的方法类似,并使用了用于Connectome重建的软件工具链,包括Neutu69,Neu3(Ref 70)和DVID71。校对过程将在下面进行详细介绍,以解释我们实施的各种阶段和广泛的质量控制措施,以有效地产生高质量的连接组。该卷的一个区别是,我们自动生成细胞体的点注释(如“ EM体积分割”部分中所述),然后在校对过程的早期阶段将点注释添加到颈部纤维和神经束中。这些注释被反馈到聚集阶段,并禁止在相应的段之间进行合并。此步骤大大减少了错误的合并物体的数量,这些数量很难分开。Optic Lobe Connectome的一个重要差异是单元格在质量控制中扮演的角色并设置一些校对优先级(请参阅“单元格键入概述”部分)。当我们从早期校对阶段键入细胞时,我们经常比较分配相同类型的细胞的形态和连通性。此步骤可作为不完整形状或重建错误的强大检查。在光叶数据集中,大多数单元和突触属于重复的单元格类型,因此这种平行的单元格和校对工作对到达高质量的连接组特别有用。
我们的最终连接组包括一组突触连接,其中突触前点和突触后点都属于被认为是追溯的神经元。也就是说,可以接受。尽管捕获100%的连接是可取的,但由于数据中的时间和限制,局限性和伪像,这在实践中是不可能实现的。我们的目标是产生一个连接组,该连接组捕获样品中最大的突触连接的实际比例,同时避免了跨大脑区域和细胞类型的突触捕获中的偏见。此外,我们旨在重建每个神经元(例如主要的arbours and the细胞体)的形态的主要特征,以促进与LM图像和/或同一样品中的同源神经元匹配(例如,跨半球或视觉柱)。我们使用了几种校对协议来有效改善跨多个维度的细分。
校对进行了一系列阶段,其中大多数校对团队通常在同一阶段工作,从一个阶段过渡到另一个阶段。将校对过程分为阶段具有多个好处。在大批量执行类似的任务时,单个校对效率会提高。由于大多数校对者都可以执行类似的任务,因此他们也可以互相协助并讨论困难的决定。重建更容易管理,协调和跟踪。此外,随后的校对阶段在整个数据集中的一致质量中受益,而不是更零散的方法。这种分阶段方法的另一个好处是,我们数据集中没有神经元是单个校对器的产物。不同的校对多次检查了所有神经元(最后,至少有一位专家神经解剖学家)。这意味着可以在多个阶段识别分割中的错误。由于任务是随机分配给校对器的,因此在校对过程中生存的错误并不符合大脑区域或细胞类型的偏见。在校对的最后阶段,校对器的任务可能与单元格类型更相关,但是在这些阶段中,通常进行的编辑相对较少。
我们的主要校对协议可以归类为自下而上或自上而下。自下而上的方案(细胞体纤维链接,骨干跟踪,聚焦合并和孤儿链接)在整个样本(或选择的子区域)中进行了许多小改进,而无需考虑单个神经元身份。在自下而上的协议中,以优先顺序为校对者预选了细粒度的任务,以最大程度地影响连接组(例如,捕获突触)。自上而下的方案(分裂和神经元批准)针对整个神经元。在自上而下的协议中,校对者使用他们的判断来指导他们的注意力并解决质量问题。
尽管我们的中枢神经系统样本包含整个大脑和神经绳,但在该项目的早期阶段,尚未完全成像和对齐。我们仅从大脑的一半开始,其中包含正确的视神经叶和(大部分)右中央大脑。校对的前两个阶段(如下所述)是在半脑部的部分上进行的,而后来的阶段是在我们进入完整大脑后进行的。
为了协助细胞键入并检测错误的合并,我们首先将孤立的细胞体(SOMATA)连接到其主轴突上。通常,这比在缺乏somata的神经元上寻找细胞体纤维更容易。在最初的分割中缺少somata非常普遍。较细的细胞体纤维在合并到它之前通常与主轴子旁边一起运行,这给自动分割步骤带来了挑战。
我们故意调整我们的自动细分步骤,以容忍一定数量的虚假合并,这些合并需要在校对过程中进行维修。这是这样调整的,因为大多数校对工作都用于合并错误的分裂神经突。如果可以使用有效的工具修复(相对较少的)错误合并,则可以调整为更具攻击性的自动细分,从而在修复过度分段错误方面更具侵略性。但是,分段中的虚假合并阻碍了校对和审查的其他阶段;因此,分裂阶段旨在消除数据集中所有主要的错误合并。我们检查了最大的50,000个段(通过突触计数),并使用NEU3(参考文献70)(主要是面向3D的工具)消除了明显的虚假合并。在检查细分市场时,校对者有机会在可能需要合并的地方将“去做”地标放在数据集上,而不会中断他们的分裂工作以执行任何合并。由于我们能够快速识别属于重复的单元格类型的许多单元格,因此我们按细胞类型对一些切割任务进行了分组。在这种情况下,校对者能够迅速熟悉正在审查的神经元的预期形态,并更加有效,可靠地熟悉点问题。在检查和裂解视频叶中最大的50,000个细分市场之后,我们在其余体积中解决了最大的50,000个段,这(当时)是大脑的一半。
消除了数据集中的大多数错误合并后,我们可以有效地将最大的片段组装成精确的细胞形状。根据突触计数以优先顺序分配段。明显的假拆分(通常在大分支上)被鉴定出来并进行追踪,理想情况下导致完整的神经元骨架。
我们的下一个目标是通过将孤儿片段合并到其父段中来提高整个数据集的突触捕获率。我们优先考虑具有较高突触计数的孤儿,以最大程度地影响连接组。如下一个关于孤儿链接的部分所述,执行此类合并的一种方法是对仔细检查感兴趣的每个孤儿进行仔细检查并找到导致相当大的神经元的路径。但是,在许多情况下,有一个更好的选择:如果孤儿碰巧直接与一个或多个神经元相邻,这似乎是一个可能的合并目标,那么我们可以通过NEU3“集中合并”协议向校对者提出一个简单的是或不决定。我们没有将每个孤儿的所有相邻神经元与校对者呈现。取而代之的是,我们使用自动分段算法最初生成的集聚得分选择了合并候选者,从本质上使用对自动化过程拒绝接受的合并的手册审查。集中合并比孤儿链接更有效。以NEU3为中心的合并协议导航到推定合并的确切位置,并为用户提供网站多个视图,此时校对者接受或拒绝单击按钮的单击。
不幸的是,许多孤儿碎片无法通过集中合并直接与目标神经元合并。我们通过突触计数将其余的孤儿放在优先级,并将其分配给校对器进行手动跟踪。孤儿链接方案的目的是找到应合并到的孤儿的靶神经元(不追踪目标神经元的其他分支)。我们注意到,如果我们不打算校对整个卷,孤儿链接将是不可接受的。孤儿链接是一种纯粹的自下而上的协议,因为人们不知道会发现哪个目标神经元。如果我们只对体积中的神经元子集有兴趣,那么自上而下的跟踪将是改善突触捕获的唯一选择,尽管它在每次捕获的伴随基础上的效率较低,而不是自下而上的方法。
一旦我们捕获了所有具有50个突触或更多突触的孤儿(或者没有找到合并的孤儿),我们就进入了校对的最终自上而下的阶段。整体校对校对神经元,检查其形态是否不一致。对于属于柱类型的细胞,将多个细胞呈现在一起以进行审查,以允许比较形态。一旦将神经元或一批神经元视为完整且没有错误,校对器就在数据库中指出了他们的批准。
我们的专家神经解剖学家(S.-Y.T.和A.N.)依靠形态学,突触计数和连通性分析来评估质量。
对于这个项目,我们的校对团队几乎全部由连接组学注释者组成,并具有早期项目的经验。所有新雇用的校对者至少接受6周的培训,在测试环境中练习成千上万个任务。在培训过程中使用自动和手动审查的混合物提供了反馈。除了新的雇用培训外,所有校对者还偶尔会在过渡到他们最近没有工作的协议之前接受复习培训。
集中合并特别适合自动质量控制。在每批任务中,我们选择了一个随机的任务子集进行质量控制,并在几个校对的任务集中重复了它们,并随机与其他任务随机混合。每个校对任务负载的大约10%由质量控制任务组成。每个校对者与多数决定的一致性率都计算出来,并为讨论和培训标记了明显分歧率的人。对真实“合并”决定的中位数分歧为0.8%,而对“不合并”决定的中位数分歧率为0.4%。对于上下文,分歧率为0.4%,对应于每250个协议的1个分歧。
由于该项目是在较大的重建(整个CNS)的背景下完成的,因此我们进行了一些近似值,以估算专门针对Optic Lobe的努力。通过对我们的任务表和细分编辑日志的分析,我们估计总共在此数据集上花费了总共2,584个校对或神经解剖学天数,约有10个校对年份。扩展数据图1b显示了该时间如何在上述校对阶段分配。
评估连接组或连接区域的完整性的重要指标是所有突触前和突触后伴侣都属于“追踪”神经元的所有突触的百分比。我们为扩展数据表1中的视频叶神经胶体提供了此完成百分比,这些摘要指标表明,这种新的Connectome是迄今为止质量最高的重建之一。整个神经膜的完成率很高且相对均匀。在整个数据集中,连接完整性为52.7%(当下讨论的部分层次被排除时,连接的完整性为54.2%)。该值大大高于对半元素的值,相应的度量为37.5%8。
但是,总体完整性可能会高,同时隐藏了更细粒度的问题。一个有用的以神经元为中心的度量是对每个神经元的“下游捕获”,定义为属于追踪神经元的追踪神经元直接下游的synapses。即使上游神经元是完美的校对,下游捕获分数的上游神经元也会具有不良的重建连接。在扩展数据中显示了下游捕获部分(不包括薄片)的分布图1c。
另一个揭示的质量度量是数据集中未合并的孤儿片段的数量和大小。由于数据伪像或特别困难的形态,此类孤儿仍然存在于数据集中。我们的目标是合并所有具有超过50个突触(上游和下游伙伴)的孤儿碎片。最终分布(扩展数据图1D)表明,该目标截止值上方有1,095个孤儿片段。剩下的未合并片段有960万,其中大多数包含很少的突触。
薄片的完成指标(扩展数据表1)比其他视神经叶神经胶质要差得多。椎板是视力叶的最周围神经胶质,其中外部光感受器的轴突接触其目标。在本卷中,由于有两个原因,薄片特别困难地重建:(1)由于20 µm板的修剪边缘的修剪边缘,它的楼梯状态不完整,并且(2)光感受器的严重轴突染色的轴突通常被严重染色,因此比其他段相比在其他几乎其他几个小节中都更具挑战性。尽管我们不是我们最初分析薄片的意图,但它的更完整的段是有用的,尤其是用于估算Eye35赤道的位置,如图3A的眼图所示。因此,尽管样本有局限性,但我们在重建层次上投入了大量精力,但是完整性指标反映了该神经质质量的质量和完整性较低。靶向髓质的染色的内部光感受器(R7和R8)也带来了相当大的分割和校对挑战。然而,我们校对了大多数细胞,除了在髓质的一个斑块中,这些末端太分散了,无法组装成神经元。这些光感受器的分布在扩展数据2中详细介绍。1G,H和5A,显示了这些数据限制如何不扩展到其他单元格类型,即使是具有附近连接的细胞类型。我们估计了“估计光感受器和椎板固有神经元的计数”部分中缺失的细胞的计数。
为了比较LM成像的神经元和从EM数据重建的神经元,我们将中央脑EM体积的3D坐标(包括视位叶)转换为用于LM数据的标准参考大脑的参考坐标。通过将男性CNS EM体积的突触云记录到JRC2018M果蝇模板55上,获得了空间转换,该方法遵循类似于半纤维素体积8所述的方法。突触预测以接近JRC2018M模板(512 nm各向同性)的分辨率渲染,以产生图像体积。接下来,我们使用Elastix72执行了两步自动图像注册过程,将JRC2018M模板作为固定图像,将Synapse Cloud作为移动图像作为固定图像。第一步估计了仿射转换,该仿射转化用于初始化第二步,在此过程中,估计了非线性(B-Spline)转换。然后,我们使用BigWarp73手动微调了这种转换,以在数据集上放置91个地标,以定义薄板样条键转换以纠正可见的未对准。这定义了我们用来扭曲从半纤维数据集的旋转神经元骨骼的初始转换,以进入该新(雄性CNS)EM体积的坐标系。我们从该体积的半神经元和初步神经元痕迹之间确定了推定的神经元对应关系,并使用这些痕迹来识别剩余的未对准。我们通过在Bigwarp中纠正了这些,将82个其他地标通过将最终的地标的总数置于173中。这些步骤(仿射,B-Spline和薄板拼接)的转换组成是从JRC2018M模板到EM空间的空间转换。我们还使用GitHub(https://github.com/saalfeldlab/template-building)的代码估算了总转换的倒数。由于JRC2018M,JRC2018F和JRC2018U之间已经定义了转换, 建立三个之一的对应关系自动为其他两个做。图7C,D,G和扩展数据图。14b和15b – f显示了使用JRC2018U模板在LM和EM(Hemibrain)图像中的Optic Lobe数据集与相似单元格中的神经元与相似单元格进行比较的几个图像注册应用。
在分割之前,使用突触点云来定义神经胶体。如JRC2018M果蝇模板55在与我们的EM体积注册后,根据JRC2018M果蝇模板55初始化了Neuropil边界。然后,根据灰度数据,对右视角叶神经胶体的边界进行了精炼。尽管有些边界很清楚,但其他边界,例如光叶内部chias的界限并不锋利。绘制每个神经胶体的感兴趣区域(ROI),以围绕相应的神经胶质中的最大突触数(不与相邻的神经胶质重叠)。我们按照视频叶和中央脑的标准命名法命名了区域61。然后,我们使用了一个迭代过程,使视神经叶建立柱和层参考,首先在经典的神经解剖学研究中报道了1,2,3。除了LM Data45的先前定义之后,我们匹配了除小叶的第五层外,我们匹配了所有经典定义的层,我们将其分为LO5A和LO5B。此过程在“定义列中心线和ROI”部分和“层ROI”部分中进行了描述。由此产生的ROI在Neuprint中可用,并系统地命名。ROI柱是通过连接神经,脑半球和六边形坐标(例如Lop R Col 15 21)而命名的,而层ROI由其神经层,脑半球和层数命名(例如,ME R层07)。
我们分析的主要数据源是Neuprint74(Neo4J75图形数据库)中的Optic-Lobe:V1.1数据集。我们访问了数据库中的三个节点:(1)段;(2)突触,是代表T杆和突触后密度的突触部位的集合;(3)突触,指的是单个突触部位。这些节点具有分层关系,段节点包含突触集节点,而突触集节点包含突触节点。段和突触集节点分别连接到其他段和突触集节点。这些连接是根据单个突触节点之间的关系计算的。所有突触节点均来自元素类型并继承其属性,例如EM体积中的3D(X,Y,Z)坐标。大多数段节点对应于少量突触的小型,未盖的片段,与大多数分析无关。为了启用更快的查询,与典型分析相关的段节点的子集也标记为神经元节点。要符合神经元的资格,一个段必须至少具有100个突触连接,一个定义的“类型”,“实例”或已知的SOMA位置。在此处介绍的大多数数据分析中,我们主要与命名神经元合作;也就是说,具有定义类型和实例属性的神经元节点。我们忽略了非神经元段,并排除了哪种类型的神经元,并以“ _unclear”的形式加以后缀,并有一个简短的重建神经元列表以忽略。
为了完全清楚地说,在图形数据库语法中,节点为“:neuron’:sengmem”,并且具有'::包含':inter's stynapsets的关系,它们具有'::包含'::synapse的关系。‘:neuron's and':Synapset的':connectsto'与其他':neuron's and':Synapset的关系。这些关系是根据“:strapseSto”的关系“:突触”节点之间的关系来计算的。每个“:neuron”和“::segment”都具有作为唯一标识符的属性“ bodyid”。从“:element”中继承的所有节点,例如“:sengment”,“:neuron”,“ neuron”和“:Synapse”,都包含空间属性,因此可以利用Neo4J的空间函数。
在Neuprint数据加载器中,ROI定义为连接的体积;也就是说,在空间上连续的体素集合。因此,可以将具有空间位置的每个元素分配给任何数量的ROI,例如我们针对层,列和神经胶体定义的ROI。这是一个简单的分配,用于点对象,例如Postsynaps,Presynaps和列引脚(如下定义)。由于突触连接通常是基于单个降临前和几个突触后密度的,因此Neuprint使用将连接分配给突触后部位的ROI的约定。
尽管我们的研究集中在视觉系统上,但几种细胞类型在中央大脑中具有过程。尽管校对和命名工作正在进行中,并且不像视位叶那样完整,但重建的arbours在数据集中包含在骨架(和网格)中,但没有突触连接。在数据库中,包括神经元的特性包括在数据库中的突触部位及其支配的大脑区域的汇总摘要。这些聚合依赖于Optic-Lobe:V1.1数据集的0.5设置的置信阈值。结果,摘要与重建的2024年代后期快照(Optic-Lobe:v1.1)一致,但是“:神经元的突触特性不同于‘:Synapse的数量':Synapse的突触特性(由于中央大脑的连接不完整,只有一半的连接)。
在Python环境中,Neuprint-Python76提供了对Neuprint服务器的访问权限,并将功能调用转换为Neo4J Cypher查询(https://connectome-neuprint.github.io/neuprint.io/neuprint.io/neuprint-python/docs/)。我们依靠Neuprint数据库的精心选择的合理默认值(最相关的是Synapse置信阈值0.5)。为了简化分析,我们将数据汇总到PANDAS Dataframes中的源数据范围尽可能接近源,或使用NeoPrint-Python的“ Fetch_custom”功能,并具有优化的NEO4J Cypher查询。我们在存储库中共享的代码(请参阅“代码可用性”部分)使用这些方法的组合进行数据访问。为了估计元素的空间位置,例如突触,与列和层有关,我们将数据类型“:columnpin”添加到Neuprint中,该数据类型“:columnpin”为Neuprint,该点代表沿每个列(髓质,小叶和小叶板的中心线)定位的点,并与代表列中的属性和属性。
除了Neuprint Neo4J数据库外,我们还通过Google储物桶提供了ROI的神经形态和ROI的边界。网格是由带有立方体的ROI产生的,然后是laplacian的平滑和脱落(https://github.com/sp4cerat/fast-quadric-mesh-simplification)。大脑区域,色谱柱和层的网格可在256 nm至1,024 nm之间的三种不同空间分辨率(每侧)(每侧的体体)之间提供,而大多数单个神经元的网格是从16 nm素体产生的。
我们分析和通过其他方法检索的数据存储在“/params”目录中的代码存储库中,例如:
Neuprint数据库内存储在Google Cloud中的预先计算的网格和“/params”目录中的数据足以复制我们的数据分析和数字的数据;例如,使用我们在存储库中提供的源代码(请参阅“代码可用性”部分)。
我们在笔记本电脑中提供代码(识字编程77),以解释长期运行过程的分析步骤或命令行脚本。两者都依靠功能用于原型实现或我们的几个应用程序之间共享的面向对象的组件。
我们数据集中的神经元都在正确的光瓣中;也就是说,在苍蝇大脑的右侧。但是,我们在图像的左侧表示这个视线叶(图1A),因为这是解剖学家最熟悉的视图(即,向下看显微镜中的样品),并且与LM数据直接相当。为了为这些视角变化提供进一步的直觉,我们显示了从大脑内部观察并向外望向右眼的髓质对应关系的坐标系(图3A)。
在整个文章及相关材料中,使用此处介绍的几种方法(以后的各节中详细介绍)进行了EM重建神经元。神经元通常显示为3D视图的拼字图;大多数是在Blender78中编程渲染的,并在“渲染神经元的管道”部分中进行了描述。
许多视觉系统神经元显示在视觉视图上,该视图是一个包含感兴趣的神经元和相关视觉叶神经膜的解剖部分。神经元的一部分可能位于切片体积之外。因此,我们使用修剪步骤来显示层神经(由于视神叶神经胶质的曲率而需要的层神经)。
尽管大多数神经元的复杂,扩展的3D形状,但神经元的2D视觉表示已成为对几代神经科学家的细胞类型的高度详细描述,从高尔基染色的神经元的手绘1,2,3到计算机生成的射线痕迹,这些射线的痕迹的射线痕迹的射线痕迹的造成了造成EM量的EM量的射线80。遵循开放科学原则,我们基于最先进的开源软件Blender78开发了一条渲染管道,该管道使我们能够在一个多世纪以来的视觉风格中生成静态可打印图像,以传达了一个多世纪以来,可以传达了可访问的科学交流的微观结构和视频。细胞类型Explorer Web资源包含交互式图81,以促进对神经元形态的个人探索。
为了渲染详细的高分辨率可打印图像和视频,我们开发了一条软件管道和集成的Neuvid82,这是用于制作视频的管道,用于我们的工作流程。在这两种情况下,我们都从单个神经元的BodyID开始(我们最常使用从每个单元格的代表性神经元列表中选择的“星神经元”,在代码存储库“/params”目录中的“ all_stars”电子表格中列出的代表性神经元列表)。然后,我们询问Neuprint以获取有关此神经元的其他信息,例如层和列神经,单元格类型名称,突触和相邻细胞(同一类型)。基于五个模板,我们将这些信息与材料属性和虚拟相机位置(代码存储库中的“渲染参数”电子表格“/params”目录中的“渲染参数”相结合到JSON说明文件中。接下来,我们使用图像管道或neuvid进行视频生成图像。根据图像和视频JSON的描述,我们从Google云存储桶中下载了神经元和大脑区域所需的网格(请参阅数据可用性部分),并将它们临时存储在本地文件系统的“/cache”目录中。
渲染是使用搅拌器用于视频和图像完成的。对于视频,我们依靠Neuvid Package82移动相机并组装单个高分辨率图像的框架。使用此管道生成了从单元格探索器Web资源链接的补充视频2和3,以及与神经元特定的视频。
对于呈现的静态图像,我们开发了管道以允许摄像机的自由定位。大多数神经元图像是从两个主要方向呈现的,类似于图1B中视觉叶的额叶和侧视图。对于全脑视图(例如,图6),我们将虚拟摄像头放置在动物的前面,其后部观看方向是正交投影的方向。对于视觉叶片的视图,我们侧向和背腹轴的几个程度(类似于图1B的侧视图)将拼字摄像头定位。在具有全脑视图的标准效果图中,我们为具有中线横断的神经元制作了全脑图像,并为所有其他神经元制作了一半以上大脑的图像。为了在视觉视图中呈现所有视叶神经元的代表性示例,我们建立了三个虚拟相机位置:用于大多数神经元的赤道视图,以及腹侧和背视图,更适合可视化神经元和类型的子集。在补充图1中,每个面板的切片位置分别用字母(E,D或V分别指示)。
全脑视图受益于不同大脑区域的轮廓,特别是两个视神经裂片和中央大脑。为了产生这些轮廓,3D网格沿着光轴从虚拟摄像头移开。网格材料在搅拌机内进行了修饰,以不反射光,并给人以幻想的幻想。然后将神经元绘制并在其原始坐标中渲染。
The optic lobe slice views (for example, Figs. 1c and 2a, and all the panels of the gallery in the Cell Type Catalogue, Supplementary Fig. 1) required substantial fine-tuning to establish representative visualizations of individual neurons that capture their layer-specific arborization patterns while visualizing the layers and capturing the axons, cell-body fibres, soma locations and, where relevant, central brain arborizations.我们通过与腹侧,赤道厚度约2.5 nm厚度的矩形立方体相交,获得了视觉叶神经胶质层的视觉表示。我们对具有100 nm厚的立方体的视频使用了类似的方法。然后将图层网格和立方体之间的相互作用表示为新创建的网格边缘周围的线框。我们使用线框用较深的颜色强调切片的边界。神经元本身被切成较厚的矩形立方体。根据细胞和神经支配模式,我们使用了750 nm厚度和3 µm厚的长方体,以限制神经元的可见部分。对于大多数神经元,我们仅在分层视觉叶神经胶体(延髓,小叶和小叶板)内使用切片,尽管我们在这三个神经胶体之外显示了所有重建的arbours。这使我们能够捕获特定层的树博化模式(由于视神叶神经胶的曲率,厚切片的投影掩盖了大多数这些模式)。对于大约100个神经元,我们将切片延伸到分层视神叶神经胶体之外。对于七种细胞类型(CM-DRA,CM27,LI37,LPI14,LPI4A,LPT30和MI20),我们手动修剪了Arbours,以实现“画廊图”部分中描述的可视化目标。每种类型的可视化的参数存储在“/params”目录中的“ all_stars”表中。
在特定的髓质层中显示神经模式,例如在图1和图2中。2e和5e,f,我们的视觉叶片视图进行了修改,以使摄像机的面向髓质层的面向视图大约90°。在这些图像中,仅渲染相关的髓质层。
对于包括突触的效果图(扩展数据图8C和15A),我们仅显示突触到/来自指示的神经元的突触,并且仅渲染边界矩形核心内部的突触。突触部位由球体表示,并分配了视觉令人愉悦的直径。
生成的栅格图形存储在本地文件系统上。在组装单个面板或图像画廊的最后一步中,例如图6中的扩展数据图13和补充图1,我们使用来自同一JSON描述的值添加文本并使用Pymupdf83库将几个图像组合到单页中。
我们通过snakemake84定义了用于长期运行和多步计算的工作流程。尽管我们对运行搅拌机的个人计算机进行了原型,并且可以在个人计算机上产生大多数图像,具有700多种单元格类型和每种类型的几种视图,但我们发现Snakemake有助于通过LSF计算集群的节点分配工作负载。
为了促进进一步的分析和数据表示,我们将每种单元格分配给五个主要组之一:ONIN,ONCN,VPN,VCN等。对组的分配是在细胞类型水平上进行的,而不是细胞水平。通常,ONIN和ONCN被定义为细胞类型,它们几乎具有所有突触(> 98%的输入和输出连接的98%),其中Onins仅限于右视角叶的单个神经胶质:Lamina,La(R);我(r)梅德拉;Lobula,lo(r);小叶板,lop(r);和附件髓质,AME(R)(每个缩写标签是Neuprint中相应的ROI的名称)。ONCN是连接两个或多个神经胶质的细胞类型。VPN在视位叶中获得大量输入,并向中央大脑进行项目。VCN还连接了视位叶和中央大脑,但具有相反的极性。“其他”主要用于具有中央大脑和视觉叶突触的细胞类型,其在右视角叶中的连接比例相对较小(因此不太适合VPN或VCN组)。
ONIN类型中包括了感光体(R1 – R6,R7和R8),因为这与它们的突触分布相匹配。但是,可以将它们视为ONCN细胞(鉴于其投影模式)。将神经元上升和下降神经元放置在“其他”组中。我们注意到,其中一些具有实质性的视神经叶突触,因此可以将其归类为VPN(例如DNP11)或VCN(例如,DNC01)类型。
尽管大多数细胞类型都根据其突触分布和整体形态明确地放入其中一组中,但更边缘的病例需要进一步的标准,尤其是在VPN,VCN和“其他”组之间进行决定。对于大多数单元,分配是基于突触连接的相对数量。要将单元格分类为VCN(VPN),而不是其他分类,我们要求将总输出(输入)连接的10%位于视位叶(两个光瓣都组合在一起的神经元中也有左视角叶中也有突触的神经元)。我们将此阈值应用于类型所有单元的平均突触。在很少的情况下(例如,DN1A和SMP217),其中一个或多种单元的一个单元格通过了10%,阈值是阈值,但单元类型的平均值没有,我们要求至少一半的单元格满足VPN或VCN标准。为此目的,对AME的处理方式与其他视力叶神经胶体相同(例如,在VPN组中放置S-LNV时钟神经元)。在“其他”组中放置的几个单元格类型(特别是PVLP046)在视神经叶附近有大量突触,但在主要ROI之外(Neuprint中的“非主题”);将这些突触视为视觉叶突触会改变其分类。
将细胞分类为VPN或VCN时使用的其他标准包括相对于视位叶和中央大脑中的总突触连接的下游突触连接的比例,相关细胞类型的分组以及植物结构的细节(例如,对于主要在Optic Lobe中主要接收到Optic lobe and Brain neuropil的主要输入和主要输出连接的单元格和细胞的细胞。当分组细胞类型时,我们旨在将“其他”类别中的单元格类型数量保持在较低。因此,我们根据可用证据的平衡,选择了VPN和VCN的视觉叶突触(10%,见上文)相对较低的最小比例(10%,见上文),并将某些模棱两可的类型分为VPN或VCN。
为了提供视神叶中单元格的几乎完整计数(与图1的图1相关,图中列出的估计值),我们考虑了数据集的两个技术局限性。首先,由于我们的体积不完全包含薄片,因此重建的LAI和R1 – R6细胞的数量是这些细胞总数的低估。其次,由于某些光感受器细胞的分割较差,因此可以可靠地鉴定出髓质中的所有R7和R8光感受器,这导致了另一个底漆(扩展数据图5A)。对于分析,我们在“/params”目录中使用了CRORCEINS.xLSX数据表。获得了大约R1 – R6细胞的数量,作为非边列的总数6(再次被四舍五入到最近的十个)。我们在三个光学叶中对标记的LAI细胞(使用Split-Gal4驱动器SS00808进行标记)进行了计数,并将圆形平均值(210)用作我们对LAI的估计。有关R7和R8数字的估计,请参见“将R7和R8光感受器和髓质柱分配给不同类型的Ommatidia”部分。
我们将形态和突触连通性与组细胞的类型一起使用(图1和2)。基于形态的键入通常是通过直接视觉检查重建的EM身体进行的。诸如细胞体位置以及arbours的数量,大小和层位置之类的特征的组合使许多视频细胞类型的细胞具有不同的外观,经验经验通常是可以直接识别的。由于初始键入与校对并行进行,因此我们对细胞形态的审查还确定了明显的重建错误和有针对性的校对工作。基于形态的细胞打字是通过大量有关光叶细胞类型的可用信息促进的3,6,19,45,85,86,包括已发表的描述和未公开的LM分析(请参阅视觉系统神经元中表达的“ Split-GAL4系”部分。细胞类型的注释是迭代进行的。随着键入(或初步键入)神经元的比例增加,我们越来越依赖突触连通性(请参阅“基于连接性的细胞聚类”部分)以确认或完善注释,以识别离群值并将细胞置于初步组中,以进行基于形态学的进一步审查和注释。
在此过程的几个周期中,并且由于数据集的高度完整性,我们将类型分配给了几乎所有重建的EM物体,高于最小尺寸(约100个组合输入和输出突触)。我们被评估为单个神经元的专家校对者的所有EM身体(除椎板中的许多人)都被注释了类型和实例。我们使用了所有可用的证据来标记一些非典型细胞(例如,在边缘附近),并给出了剩余的750个身体名称,包括“ _unclear”。这些不清楚的类型提供了一些信息(例如,R7_UNCLEAR),但指示当前未解决的打字状态(这些不清楚的物体中,大约600个是R7或R8光感受器神经元,我们认为这过于不完整,或者是从列中我们无法分配为浅或黄色的列(请参见下面))。在100个连接阈值上方数据集中的大多数未命名的物体都是较小的片段,这些片段主要是层中注释的神经元和物体的部分切断的部分,其注释和校对的片段比Optic Lobe的其他部分不那么完整。为了支持校对工作和基于连接性的聚类,我们还将候选类型分配给一些较小的片段;其中大多数最终与其他EM物体合并,但是在Neuprint的“实例”字段中,大约有700个此类碎片注释仍然可用。细胞键入的其他方面在“细胞类型命名法”,“细胞类型组”和“基于连接性的细胞聚类”部分中解决。
对于尊重历史用法的同时,在系统地描述每种细胞类型的细节的同时,这组神经元的多种神经元集可能没有完美的命名法。除了遵循历史先例外,我们还旨在使用通常更容易记住的简称,并且在大多数情况下,还表明(通常是)单元格与视觉系统相关联(图1和2)。Visual System数据集中使用的大多数单元格类型名称,此处介绍的现有名称和新名称,包括一个简短的基本名称,例如TM,DM或LOVP,提供了对神经元的广泛分类,然后是区分此组中各个类型的数字。
ONIN和ONCN的许多单独的单元格类型名称基于Golgi3先前研究中提供的系统名称,该名称提供了我们为新细胞类型命名的许多基本名称。除此资源外,还包括以下名称来源(和描述)的神经元的来源:几个ONIN和onCNS 6,7,9,38,87,88,DM和一些PM细胞和一些PM细胞19,TM5A – TM5C89,TM5A – TM5C89,DRA NEURONS23,90,LCS45,85,86,LPCS和LLPCS和LLPCS和LLPCS和LLPCS和LLPC,OA Neurons49,许多VCN和VPN以及一些LI细胞8。对于新名称,我们引入了其他单元格基本名称,这主要是用于VPN和VCN的新系统命名方案的一部分。
VPN或VCN的大多数新名称均遵循以我,LO或LP开头的格式,该格式指示主神经胶片一个单元格类型具有输入突触(用于VPN)或输出突触(对于VCNS),然后由VP或VC和VC和一个数字和数字。对于在两个或多个神经胶体中具有突出输出的VCN,我们使用了以OL(用于Optic Lobe)开头的名称。对于双侧细胞,在VP或VC之后包括第二个(左)视力叶中神经胶体的附加指标(例如,MEVPME1)。除了这些系统的名称外,一些新名称还基于现有的命名方案,扩展了用于类似单元类型组(例如LC10E和LLPC4)的基本名称。
我们为VPN和VCN Neurons8保留了许多半功能名称,但是如果以前的名称省略了任何明显的视觉系统连接的迹象,我们引入了基于中央大脑区域的新同义词(例如,pvlp132 for pvlp132)。对于未归类为VPN或VCN的几种细胞类型,具有中央大脑和视觉叶突触,而是“其他”(在“细胞类型组”部分中进行了描述),我们使用了其半纤维名称。在三种情况下,我们应用了一个占位符名称,并添加了“ _tbd”,因为我们预计未来的中央大脑数据将提供更合适的名称。
我们还引入了两个新的单元格基本名称:CM和MELO。CM细胞是中央延髓,命名为补充现有的DM(远端髓质)和PM(近端髓质)基础名称。该基本名称应用于M6和M7层的主要arbours的髓质固有神经元。Melo base名称是髓质和小叶的前两个字母的简单收缩,并应用于连接髓质和小叶的ONCN细胞类型,但不通过内部chiasem进行突出(与TM细胞相反)。CM和MELO取代了我们在以前的工作中从这些组中使用的少数细胞类型使用的MTI和ML标签。23。
视觉系统单元类型的一些已建立名称包括字母,以指示超出共享基本名称和数字的进一步分区;例如,LC10类型分为LC10A,LC10B等。在大多数情况下,我们继续使用这些现有名称(例如,引入了这种类型的几个名称以细分现有类型)。至少在视觉系统中,字母和数字的使用尚未标准化。也就是说,LC10A和LC10B不一定比例如LC6和LC16更密切。我们也没有在通过形态与连通性鉴定的类型之间进行形式的区别(如中央脑神经元的半元素数据集8所做的那样)。许多细胞类型最容易被连通性区分,至少在人群水平上仍然显示出其他解剖学差异。在两种情况下,我们命名了现有名称已经包括字母(LC10C-1和LC10C-2和LC14A-1和LC14A-2)的细胞类型的细分类型,但不主张更多地广泛使用这种做法。
同名应用于类型的所有单元格中,具有基本名称建议的特征的形态变异性。例如,几个TLP13细胞在髓质中有分支,使它们类似于Y神经元,但是由于这不是整个类型的特征,因此我们保留了TLP基础名称。
基本名称附加的数字有很多差距。例如,我们的TMY神经元列表始于TMY3和TMY4,跳过TMY1和TMY2。我们这样做是为了最大程度地减少对以前用法的困惑。参考文献中说明和以前命名的一些细胞类型。3(很长一段时间以来,果蝇视叶中神经元的细胞类型信息的主要(如果不仅是)似乎代表了其他类型的变体。例如,从以前的研究中标记为TM6和TM14的细胞类型均与我们的TM6匹配,而MI8可能是非典型MI1。此外,该研究3标记TM15和TM20的细胞类型都类似于我们的TM20。其次,为避免与较早的研究的不正确匹配(某些细胞类型很难与单视图GOLGI图纸可获得的有限信息匹配),我们和其他人在命名其他类型时的最新努力(例如,此处继续用于许多细胞类型的练习,例如TM细胞))。
图1显示了Optic-Lobe:V1.1数据集中的视觉神经元的概述。补充表1列出了732个独特的单元格类型和778个独特的单元格实例。
对于图1D,我们考虑了属于“细胞类型组”部分(Onins,OnCN,VPN和VCN)中定义的四个主要神经元组的所有细胞类型,并报告了每种细胞类型的输入和输出连接的数量和输出连接的数量。有不同的方法来计算数据集中的连接,因此必须澄清我们的约定。突触连接(或简单的连接)是一个身体上的成对前,另一个身体上的匹配后伴侣。自动化(自我连接)已从数据集删除,我们的大多数分析仅限于命名的神经元(请参阅“单元格键入概述”部分)。由于连接是定向的,并且在两个段之间,因此连接的每一侧都可以算作输入连接或输出连接。图1中的计数报告了图1D中列出的160个单元格类型的这些输入和输出连接(在每种类型的所有神经元中汇总)或每个组中的所有单元格(图1E)或神经皮和组(图1F)(图1F)。在其余的分析和材料(突触完整性的分析除外)中,我们报告仅限于已识别(命名)细胞之间的连接。因此,例如,在“单元格类型探索器Web资源”上找到的计数预计会较低(数据集的平均连接完成百分比约为53%)。前共生用于T-bar(突触前活性区)的计数。伴随后用来指的是相反的前共生的突触后密度计数。由于突触连接是不对称的,因此一个通常与多个伴随的伴侣相反,因此神经元中的后序列计数与输入连接的数量相同,但是Presynaps的数量与输出连接的数量并不相同。这种差异与神经元的“狂热”有关,该神经元在图4i中进行了检查。前共生和结合后的完成百分比也有不对称性(扩展数据表1), 这解释了为什么在查询数据库中的神经元连接时,输出连接号高于输入连接(如图1中)。几乎所有(大约97%)输出(通过前共生)已分配给一个命名的神经元,而大约55%的synapses分配给了命名神经元。这种连接不对称与果蝇突触的物理结构有关,其中一个神经元的一个大型突触前区域通常接触通常多个不同神经元的多突触后部位。这些突触后地点通常位于更细的位置,比前共生更难重建过程。
在图1F中,如果在相应的Neuropil ROI中包含神经元的神经元,则将神经元分配给五个视力叶神经胶体之一。同样,如果属于该细胞类型的所有神经元的总和列出的所有神经元的2%,则将神经元类型分配给视力叶神经胶体之一。确认所有五种固定层切向(LAT)类型在层中具有arbours(LM数据,未显示),但是由于远端层不在EM体积中,我们捕获了它们的突触很少,因此在图1F中未计数某些LAT类型。对于图1G,我们考虑了732个单元格类型之间的所有连接(> 1),并报告了每种单元类型的连接输入单元格和输出单元的平均数量。
要通过连通性将单元格分为类型(图2和扩展数据图3),我们将汇总连接性与命名单元格类型作为聚类的基础。对于要聚类的每个重建的EM主体,我们计算了其连接的总和,将其进一步分为输入和输出与数据集中每个命名单元格类型的所有单元格(不包括与具有“ _unclear”类型注释的单元格的连接)。与两个光学叶中突触的单元类型的连接进一步划分为实例(右侧和左侧),因为相同类型的单元格的左和右右视线片中的连接性可能大不相同。在计算相应的单元格类型时,在计算汇总的连接权重时,包括与单元格类型的“片段”相应的小体(例如,neuprint中的实例melo9_fragment_r)。在重建的主动校对阶段,不包括“不清楚”细胞和添加“片段”至关重要,当许多EM身体仍然存在明显的重建误差或明显不完整时。最后,由于此处报告的数据集不包括中央大脑中的详细连接性,因此我们仅在正确的光叶中使用了连接,为此,这是LA(R),ME(R),LO(R),LOP(R),LOP(R)和AME(R)ROIS中的连接之和。
所得连接表用作分层聚类的输入。使用Scipy.Hierarchy92和FastCluster93库在Python中进行聚类。我们将Ward的链接方法与余弦距离使用为度量,基于观察到的基于专家策划的基于形态学的细胞键入(不要与基于“形态聚类”部分中量化的形态的独立聚类相混淆)与连接性聚类中所述的量化形态的良好一致性(图2和扩展数据。图2和扩展数据。使用余弦距离的关键方面似乎是计算该度量标准的一部分的归一化。L2连接表的每行的归一化,然后与病房联系和欧几里得距离聚类产生了相似的结果。将聚类输出分为预选的簇数(使用带有maxclust标准的scipy.hierarchy.fcluster)。对于形态上不同的细胞类型,连通性聚类主要用作预选细胞的方法,以进行后续形态的键入。对于其他细胞类型,连通性是细胞组的主要决定因素,审查细胞形态主要用于识别异常值,例如具有明显重建误差的细胞。但是,我们注意到,对于最初通过连通性聚类分离的几种细胞类型,我们至少确定了两个细胞群体之间的至少某些形态学差异(例如,植物扩散或细胞体位置的差异)。
为了说明较大的细胞组的聚类,我们使用了15种柱状细胞类型(图2D)和髓质的ONIN神经元,每种类型≥10个细胞作为示例(扩展数据图3A)。对于第一组,我们将簇数设置为类型数量(在这种情况下是由形态独立定义),并观察到单元类型注释和群集分配之间的一对一对应关系。在第二个示例中,我们选择了许多略微超过类型数量的簇(对于每种类型≥10个单元的68个髓质ONINS的80个簇)。在这种情况下,尽管大多数群集仅包含单一类型的单元格,但某些单元格类型并未分离(但可以通过重凝集),并且某些其他类型(基于共享特征,空间覆盖范围或驱动程序的遗传信息组合为一种类型)分为多个集群。此示例说明了为什么需要其他标准(如下所述)来确定应该将哪些簇注释为不同类型的群集。
两个细胞群之间的连通性差异并不意味着这些类型不同。因此,我们考虑了几个因素,包括细胞形态,连通性差异的一致性和幅度,以及以拆分-GAL4驱动线模式的形式使用的遗传信息,以帮助决定何时将细胞分为单独的类型。此外,我们依赖于视神经叶中重复神经元的空间分布,因为许多细胞类型形成了覆盖神经纤维的镶嵌物(图2G和扩展数据图4)。为了进行此分析,我们使用连接聚类将现有类型或类似类型的组合分为两组(或更多)组,并绘制每个组中各单元的位置(计算为其突触的位置的质量中心)。通过绘制前两个主要组件(PC),将位置转化为2D表示(为每种神经胶体的一组预选突触获得,以使跨细胞类型的视图标准化;例如PC1ME和PC2LO,例如,用于第一和第二PC,用于在Medula和Lob中的候选细胞类型的突触,以查看第一和第二PC。通常,我们认为将分裂成两种常规的重叠模式(马赛克)的组合,尤其是当结合一致的连通性差异时,是将细胞群体分为两种类型的基础。扩展数据图4显示了应用此方法所产生的结果的示例,范围从清晰的案例拆分具有重叠的镶嵌物的细胞到区域模式或模式,没有明确的空间结构以及仅适度的连通性差异,这些差异并未进一步细分。
我们注意到,我们的某些单元类型由单个单元组成,我们单独命名(通常应用已建立的名称),因为可用的证据表明它们是唯一可识别的。但是,一些具有独特名称的单元属于覆盖部分或所有列的小组类型,可以使用类似的覆盖标准将其合并(示例是HS细胞,分别键入为HSE,HSN和HSS或CH单元,或CH单元,或单独键入为DCH和VCH)。
R7和R8光感受器每个都存在于三个主要亚型中,其光反应不同,主要是由于不同的视紫红质表达90。在大多数Ommatidia中,亚型存在于三种组合之一,R7D/R8D(DRA光感受器),R7Y/R8Y(黄色R7/R8)或R7P/R8P(Pale R7/R8)。先前的研究表明,这些亚型的突触连通性以及相关细胞类型的特定形态特征或DRA区域的特定形态特征有所不同,感光体本身为23,94,95,96。由于在EM图像中无法直接检测到Rhodopsin的表达(如果没有在本或以前的EM研究中未使用的其他遗传标签),将候选者和黄色的光感受器亚型分配给EM重建,以依赖于形态学特征(列出了一列中特定细胞类型中的羊膜轴类型)。如下所述,我们同时使用了这种解剖标记和突触连接性,将候选子类型分配给该数据集中的重建的R7和R8光感受器。我们使用突触连通性来区分先前研究(主要是TM5A和AME12分支)中建立的不同的感光体和解剖标记,以将亚型分配给这些组。形态学标记还使我们能够在不依赖突触连接的情况下区分光感受器基团,并分配一些没有重建的R7或R8光感受器的列(扩展数据图1G,H)为黄色或苍白。但是,如下所述,尚不清楚可用信息是否足以预测所有R7和R8光感受器的亚型,因此我们键入了大量的细胞(和列)为“ R7_UNCLEAR”或“ R8_UNCLEAR”。
我们根据R8D细胞的异常层模式鉴定了DRA感光体R7D和R8D,与其他R8类型相比,该模式与R7D的其他R8类型相反,并且将R7D和R8D的独特突触连通性投影。
我们将非DRA R7细胞根据其相对的突触连接数量与两对细胞类型的相对数量:TM5A Plus DM8A和TM5B加上DM8B(扩展数据图5C)。我们根据先前关于R7亚型与这些神经元的选择性连接的报告选择了这些细胞类型。R7细胞使用其所有突触连接的连通性聚类产生了几乎相同的分裂。由于DM8A和DM8B,TM5A和TM5B对于通过连通性对R7细胞进行排序至关重要,我们确认这些类型的键入本身并不取决于R7和R8细胞的亚型分配(扩展数据图5C,D)。
遵循以前的研究23,94,95,96,我们研究了TM5A,DM8A,DM8B和AME12分支的形态的不同特征,作为黄色和浅色柱的候选标记(补充表3中总结)。对于TM5A,我们寻找从M6层远端延伸的突出的arbours。这些分支通常代表这些细胞单个主植物的远端部分,主要位于单列中,尽管少数TM5A细胞具有一个以上的远端分支。对于DM8A和DM8B,我们确定了从M6层到M4的突出的远端投影(有时称为“家用柱”分支)。与已发表的工作95,96一致,大多数DM8细胞都有一个这样的分支。有些单元具有多个或没有清晰的家用柱植物库。这些家用柱的识别主要基于对DM8细胞的目视检查(由连通性选择的候选细胞)。我们注意到,对于小型垂直分支,是否模棱两可是否是家用柱arbours。我们没有尝试引入DM8家用列的更定量的定义,因为目前尚无EM分辨率的解剖基础真相数据(对于测试用于识别浅黄色柱的定义的实用性,这是必要的)。AME12神经元是大细胞,在延髓柱的子集中,具有沿光感受器沿层M6层的远端投射的薄过程,我们搜索了具有此类垂直分支的柱。要将这些不同的解剖学特征放在特定的列中,我们将它们与相邻的R7或L1单元格匹配,后者用作列标记。
我们发现,几乎所有具有突触连通性建议的候选R7Y细胞的色谱柱都包括TM5A植物园,但缺乏垂直AME12分支,这与R7Y神经元的期望几乎完全一致(据报道与TM5A有关,但与TM5A有关,但与AME12垂直分支无关)。因此,我们将此子集键入R7细胞为R7Y细胞。我们发现,这些R7Y细胞通常也与一种DM8类型(DM8A)的垂直分支相关,从而确定了这些列的潜在附加标记。尽管大多数R7Y细胞都是根据形态和连通性注释的,但仅将一种类型的证据用于这些分配的一小部分。
我们还发现,如上所述确定的强R7Y候选物的数量(244)大大要小于此大小的R7Y细胞的预期总数。我们的预期黄色与浅黄质的比率约为1.5(雄性苍蝇可能更高),我们估计数据集House R7Y细胞中约有770个非边缘非dra柱中约有460个。即使考虑到数据集中R7和R8细胞的不完整重建,这些数字也表明第二组R7细胞(显示出与DM8B和TM5B的优先连接性,并且在大多数情况下,在没有TM5A分支的列中,或DM8A HOME柱进程中的列中)包括大量的R7Y单元。在没有可靠细分的其他标记的情况下,我们决定仅在该组中键入该组中的细胞,这些细胞以AME12分支为R7P,并将其余细胞标记为R7_UNCLEAR。我们注意到,并非所有AME12分支都经过重建或鉴定,从而导致不仅黄色,而且淡淡的R7细胞。我们的结果表明,黄色R7(和R8)细胞(由Rhodopsin表达定义)的可能性可能终止于不同类型的髓质柱:具有TM5A和DM8A ARBOURS(此处识别为黄色柱)和其他与苍白光感受器输入的列(此处识别为黄色柱)和其他更相似的列。进一步检验该假设可能需要新的实验数据。尽管对浅黄色柱的潜在附加标记的LM分析显示了两个DM8亚型:一个(YDM8)与黄色和一个(PDM8)相关,带有浅色柱。但是,YDM8和PDM8与连接定义的DM8A和DM8B之间的确切对应关系尚不清楚。例如,我们发现了类似数量的DM8A和DM8B细胞,而YDM8据报道超过了PDM8。
根据同一列中的R7细胞选择R8细胞的亚型。我们还提供浅色,黄色和DRA的柱子注释(补充表3)。在没有足够重建或最终键入的光感受器细胞的情况下,柱标签基于TM5A和AME12形态标记。
我们将神经元分配给了髓质中的892个六角形坐标,以迭代地完善分配的多步过程(图3)。首先,我们使用以下连接的前同类和结合点手动将髓样坐标分配给11种类型的单个单元:L1 -MI1,L2 -TM1,L3 – MI9,L4 – MI9,L4 – TM2,L5 – MI4和L3 – TM20。使用这11种细胞类型的髓质前共生的空间分布,我们使用第一个主成分计算了每个髓样坐标的直线中央轴(原始柱)。
其次,我们使用这些线性轴使用髓质中的以下配对连接分配了13个单元格类型的六边形坐标:L1(L1 -MI1,L1 – L5和L1 – C3);MI1(L1 -MI1,L5 – MI1和MI1 – C2);C3(L1 – C3,L5 – C3和MI1 – C3);T1(C3 – T1);L2(C3 -L2和L2 -T1);TM2(L2 – TM2);TM1(L2 -TM1和C3 – TM1);L5(L1 – L5,L2 -L5和L5 -MI1);Mi4(L5 – Mi4和Mi1 – Mi4);MI9(MI4 – MI9,TM2-MI9和C3 – MI9);TM20(MI4 – TM20,TM1 – TM20和L2 – TM20);C2(L1 – C2,MI1 – C2和L5 – C2);和L3(L3 – MI9,L3 – TM20和L3 – MI1)。对于每个配对连接,突触都分配给最近的坐标轴,并将单个单元格标记为突触分配的模式。对于标记不同列的配对连接的单个单元格,我们手动检查了相对于相邻坐标中相同类型的单元格的位置,以分配坐标位置。我们还使用与其邻居相关的手动检查来验证缺少或重复细胞类型的坐标并验证每个细胞的分配。
第三,我们使用了这13个单元格类型的前共生来计算每个列的弯曲中心轴的原型,我们称之为柱状引脚或列中心线(如下所述)。然后使用这些原型柱销自动将列分配给以下15种单元格类型:L1,L2,L3,L5,C2,C3,C3,MI1,MI1,MI4,MI9,MI9,T1,T1,TM1,TM2,TM4,TM4,TM4,TM9,TM9和TM20。和以前一样,我们从视觉上检查了每个单元格与分配给相邻坐标的单元的位置,以验证缺少或重复细胞类型的坐标,并验证每个单元的分配坐标。最终坐标分配总结在图3A和补充表3中。我们不使用具有多周式过程的L4单元,或者使用多周式过程,或TM3单元,这些过程无法可靠地分配给其他细胞类型的常见坐标。通过使用大量的神经元类型,柱状坐标的识别对于细胞类型和重建误差的可变性是可靠的。
为了在小叶板中创建柱,并在髓样板柱之间进行映射(图3和扩展数据图6),我们使用了每种T4类型的神经元:T4A,T4B,T4B,T4C和T4D。我们使用T4细胞的原因三个原因:(1)每种类型的轴突支配了小叶板的四层之一;(2)他们的树突获得强大的MI1输入;(3)每种类型的T4神经元大约与延髓柱(T4A,849; T4B,846; T4C,883; T4D; T4D,860; MI1,887)。将T4神经元分配给髓质柱的主要困难是T4树突不是严格的柱状,而是支配约六个髓质柱,并且在许多情况下,不可能将单个MI1的独特分配到每种类型的单个T4。但是,一旦将T4神经元的所有树突分配到髓质坐标,我们就可以在小叶板中使用相同的坐标分配,从而将延髓柱与小叶板柱联系起来。
为了在每种类型和MI1神经元的T4神经元之间获得几乎独特的分配,我们设置了一个全局优化问题(在图理论中称为“最大权重匹配”)。首先,对于每种T4类型(我们称为T4X),我们创建了一个连接矩阵,其中包含MI1神经元和T4X神经元之间的连接数。然后,为了说明髓质不同部分突触数量的偏差,我们通过每个A MI1神经元与所有T4X神经元的连接总数进行了归一化;也就是说,我们定义了一个归一化的连接矩阵。最后,我们从scipy.python linear_sum_assignment函数中获得了推定的MI1 – T4X分配。
如果神经元之间的距离太大,则拒绝推定的MI1到T4X分配(见下文)。我们测量了MI1神经元I和T4X神经元J之间的距离,其中表示欧几里得规范,是从MI1神经元I到任何T4X神经元的平均位置,并且是T4X神经元J的均值位置。假定的MI1 – T4X对之间的距离分布显示出差距约为8μm(大约是髓质层M9中的柱之间的距离),我们选择的距离是我们拒绝推定的MI1 -T4X分配的距离阈值。补充表4中详细介绍了该分配过程的结果,并在扩展数据中进行了总结。
为了在小叶板上创建列,我们将有效分配定义为至少四个分配给同一MI1的不同类型的T4神经元组的组,但至少三个T4神经元足够接近分配的MI1。这些T4神经元的轴突上的平均位置为我们提供了至少三个点,以创建小叶板柱。此过程创建了712 MI1 – T4有效组,所有4种类型和75组具有三种类型。
柱ROIS细分A Neuropil ROI,基于柱的中心线(PIN)(图3)。柱引脚的基本思想是,它是一条平滑,略微弯曲的线,它穿过分配给相同六边形坐标的特定神经元突触中心(如前几节所述)。更正式的是,引脚是从Neuropil ROI的顶部开始的3D点(PIN点,称为柱子)的列表,并在底部结束。
从髓质中的神经元到六边形坐标分配(15种细胞类型,如“将神经元分配给髓质六边形坐标”部分所述),我们构建了与六边形坐标α相对应的PINα,根据以下八个步骤:
此计算的参数存储在“/params”目录中的“ pin_creation_parameters.xlsx”文件中。
要在小叶和小叶板中创建销钉,我们首先需要神经元到辅助坐标。在小叶中,通过选择神经元的神经元(即TM1,TM2,TM4,TM4,TM9和TM20)来遗传此分配。对于小叶板,我们使用了T4神经元,因为它们同时支配了延髓和小叶板。我们通过将每个亚型的T4神经元分配给MI1神经元(从“将T4神经元分配给MI1细胞分配给MI1细胞)以将坐标系扩展到圆锥形板板的部分,然后使用六边形坐标分配MI1来将T4神经元分配给六边形坐标。
在小叶和小叶板上构造销钉的步骤与构造髓质销钉的八个步骤相似,但也存在重要差异:
要求标准(i)执行步骤(7)。强加了标准(II – III),因为否则,突触位置RI(步骤(3)之后)可能远离顶部和底部Neuropil ROI,例如,如果缺少细胞TM20的小叶。在这种情况下,PIN通常会被倾斜。我们建议在小叶中更完整的神经元到远远的坐标分配,而小叶板可以消除对这些标准的需求。
基于参数NSAMP,我们生产了沿着其中心线121点的髓样销,叶齿针,76点和51点的小叶板销。这种离散化用于测量沿每个引脚的突触的位置,我们称之为其深度。由于步骤(d)的标准,在小叶中仅创建了870个销钉,在小叶板中仅创建了783个销钉。这些引脚不如髓质中的销钉。因此,对于小叶和小叶板,我们通过使用邻居将现有销和填充丢失的销钉定于现有销钉来迭代完善销钉。迭代算法用销钉αnew取代了引脚αOLD:如下:
如果没有再填充销钉,则停止了迭代。这在小叶中进行了2次迭代,导致了875个销钉和小叶板中的3次迭代,提供了817个销钉。
鉴于神经ROI的所有引脚,可以通过最小的欧几里得距离为Neuropil ROI中的任何3D点分配给PIN。也就是说,如果最小的欧几里得距离与引脚α在所有销钉中最小,则分配给引脚α。一个点到销点的最小欧几里得距离定义为该点的最小欧几里得距离与该销钉的任何销点。我们用它来表明弯曲的中心线是髓质中神经元形状的更准确的模型,因此与直线相比(在扩展数据中进行了量化图6A,在该图6a中进行了量化,其中通过这种方法将前同类和后结合物分配给柱上)。精确点存储在Neuprint中,可用于有效地分配突触到列和相应的深度。有关详细信息,请参见“ Connectome数据访问概述”部分。
图3D中所示的柱子ROI是通过以512 nm的分辨率统一对相应神经ROI的盒子进行均匀采样的。然后,如所述,为Neuropil ROI中的所有采样3D点分配了PIN。分配给同一PIN的所有3D点构成列ROI。如果需要做出更精细的分辨率,则将列ROI升级为止。不同分辨率的分配产生了略有不同的结果。这些列ROI可以促进定量,如图3E和扩展数据图7以及可视化(扩展数据中的示例图6c,d)。
由于销钉是从固定数量的步骤中从神经ROI的顶部到底部的3D点的有序列表,因此我们可以将列表的顺序视为层深度的指标(图3)。具体而言,对于神经胶质ROI中的任何3D点,我们找到了最接近3D引脚点的顺序(就欧几里得距离而言)。我们将“深度”定义为标准范围为0到1之间的数字,使得0对应于引脚中的第一个点,而对应于最后一个点。通过将深度分配给突触,我们计算了1D突触分布。对于图3C和扩展数据中的分布图7a,将突触分布分布为2倍。对于细胞类型的一维突触分布,我们在三个神经胶片中,将其所有神经元的所有突触都取决于销钉中的每个神经胶片中的每个神经元中的每个神经元。
层ROIS根据定义层边界的深度阈值来细分神经ROI。选择每个深度阈值作为细胞类型的峰值或结肠后分布中峰的切割(小叶板除外,请参见本段的后期)。细胞类型的选择,前一个吸盘或后结的选择,这些峰以及我们选择了峰的上或下截止,由LM图像指导,以匹配这些层的先前概念。在图3C中,我们显示了EM和LM图像之间的对应关系以及定义层的指定标准。在小叶板中,每个深度阈值定义为两个T4型深度阈值的平均值。我们使用了两种类型的阈值的平均值,因为不同的T4类型之间存在深度(因此,将层与第2层的底部分开定义第3层的顶部无用),如LM图像中可以清楚地看到(图3C,右)。
使用以下步骤确定1D突触分布的峰值截止值,该步骤取决于一个参数frac_peaks:
我们根据1D突触分布的峰值选择了每个神经胶质的frac_peaks,如下所示:hedulla中的frac_peaks = 0.85,在小叶中,frac_peaks = 0.8,在小叶板中的frac_peaks = 0.75。这些参数,每个Neuropil ROI的所需层数和其他一些值都存储在“/params”目录中的“ layer_creation_parameters.xlsx”表中。
我们可以将相同的深度阈值应用于所有销钉以制造层ROI。但是,如果直接完成,我们发现由于引脚的离散化而表现出遮挡性。因此,我们采用了平滑程序。我们将每一层的平滑网格定义为α形状,取决于两个参数:α和frac_ext。这些构造如下:
我们使用α= 0.0006和frac_ext = 1用于髓质,而小叶和小叶板使用了α= 0.0004,frac_ext = 0.5。这些参数存储在“/params”目录中的“ layer_mesh_creation_parameters.xlsx”表中。请注意,较小的α对应于横向尺寸中较小层的更平滑和较小的frac_ext。所得的光滑层网眼可能略有重叠和/或缺少少量的Neuropil ROI。这些光滑的层网格仅用于构建层ROI。
与ROI类似,图3D中所示的层ROI是通过以512 nm的分辨率在相应的Neuropil ROI周围的盒子均匀采样的。然后,为Neuropil ROI中的所有采样3D点分配了两步过程。首先,将Neuropil ROI中的每个3D点划分为推定的层,从而导致“块状”层。其次,通过循环循环通过平滑的层网格(从上到下),并分配一个层,如果该点包含在该光滑的层网格中,则分配了分配。假定的分配对于考虑到任何光滑的网格覆盖的Neuropil ROI中的少量。通过分配给后一层,处理了两个光滑层网覆盖的体积。分配给同一层的所有3D点构成层ROI。ROI层存储在Neuprint中,这是我们使用它们在图1和图2中的每个层中获取突触的方式。4G,5B和7H以及单元格探索器Web资源。
Neurotransmitter assignments used as the ground truth for training and evaluating neurotransmitter predictions (see below) came from the literature or new experiments and are summarized in Supplementary Table 5. We primarily used data from the literature33,38,49,87,98,99,100,101,102,103 for training data and performed new experiments to generate an expanded set of evaluation data (Fig.4)。已发表和新实验都使用分子标记的表达,在mRNA或在少数情况下蛋白水平在蛋白质水平上作为神经递质的指标。使用鱼生成新数据。我们使用了这种方法的两种改编,Fish37,104和Easi-Fish36。Janelia项目技术资源和飞行员项目团队的成员分别使用已发表的协议进行了EASI-FISH和FISH实验。我们使用斐济定性地评估实验的这些结果,并选择以进行显示的部分。我们通常调整图像堆栈的亮度和对比度,以进行评估和显示。使用拆分-GAL4系列鉴定了感兴趣的细胞类型,以特异性标记这些细胞。在某些情况下,使用相同的驱动程序线检查了多种单元格。当这些细胞类型的Soma位置明显不同时,或者一组具有重叠细胞体位置的神经元的细胞显示出具有相同鱼类探针的信号时,这是可能的。在大多数鱼类和EAI-FISH实验中,我们仅探测了胆碱能,谷氨酸能和GABA能传播的标记(CHAT/VACHT,VGLUT和GAD1探针)。在少数情况下,我们仅遵循第一轮的章鱼,5-羟色胺和多巴胺标志物的探针,当时我们怀疑有AMINEGIC表型,或者使用第一个探针集的结果在感兴趣的细胞中没有明显的信号。我们承认,这种方法可能会错过某些共同传输案例, 但使许多实验效率更高。它也部分通过出版的AMINEGIC TRAMSION37的鱼标记物的分布来证明,该分布仅显示少数细胞内或附近的光叶或附近的明确标记的细胞,或者对于多巴胺,包括许多小细胞体内的细胞体内的许多小细胞体,但建议(通过与分裂的Gal4驱动器共同贴上这些属于这些ni的固定型),即在这些小细胞中,这些小细胞是主要的,即不可分割的ni。补充表5列出了88种细胞类型的神经递质数据,这些数据未包括在训练数据集中。The 78 evaluated as ‘validation with new experimental data’ in Fig. 4e are based on this set, excluding the uncertain types ([Cm11] and [Pm2]; the square brackets denote potential expression in a group of cell types), those with co-transmission or unclear labelling (Mi15, CL357, l-LNv, MeVC27, OLVC4 and T1), and assigning histamine to HBeyelet,R8P和R8Y并将后两种视为一种类型。
我们使用现有方法41预测了Optic Lobe数据集中神经递质的身份(图4)。我们首先在EM量(640×640×640 NM3)上培训了一个图像分类器网络,以预测每个突触前部位是七种可能的神经递质类型之一(及其常见的缩写):乙酰胆碱(ACH),谷氨酸(GLU),GABA,GABA,HISTAMANINA(MESAMANINAINA(dopamine)(oaamine(oa))(dopamine(oa))5-羟色胺(5HT)。在“神经递质预测的培训和评估数据”部分中描述了基础神经递质类型,并基于先前的实验数据,在补充表5中详细介绍。整个神经元(ACH,GLU,GABA和他的)或个体突触(由于DOP,OA和5HT的验证)均可训练,OA和5HT的验证均分配了验证,该神经元均可训练,OA和5HT的验证均分为差异。分别为每个分区中相似的类频率优化70%,10%和20%。模型包括一个额外的类,以指示非突触或未识别的结构,该结构通过在所有突触位置的边界框中进行随机位置进行训练。
In neuPrint, the computed probability of each neurotransmitter type is attached to the presynapses and can be queried using the following properties: ntAcetylcholineProb, ntGlutamateProb, ntGabaProb, ntHistamineProb, ntDopamineProb, ntOctopamineProb and ntSerotoninProb.值范围从0(不可能)到1.0(某些),总和至1,应解释为相对概率。突触级神经递质预测的准确性在图4B中评估。尽管训练数据仅限于高信心(≥0.9)的突触,但为了评估训练有素的网络的性能,我们产生了一个混淆矩阵(图4B),显示了测试数据集中的分类结果,并具有1,014,151的突触,并检测到了检测到的突触。 <0.9.
In addition to these synapse-level predictions, we provide aggregated neurotransmitter predictions (with quality controls applied, as explained below) at the neuron and cell-type level, which are stored in neuPrint as properties predictedNt and celltypePredictedNt, respectively. First, we computed the neuron-level neurotransmitter confidence score as previously described41 and assigned the most frequent presynaptic neurotransmitter as the prediction of the neuron if that cell has ≥50 presynapses and confidence ≥0.5. Similarly, we computed the cell-type-level confidence score and assigned the most frequent presynaptic neurotransmitter as the prediction for each cell type if the type has ≥100 presynapses (summing over all neurons of the type) and confidence ≥0.5. Individual neurons and cell types that did not meet these criteria were labelled with ‘unclear’ neurotransmitters. Finally, we provide a consensus neurotransmitter type (in neuPrint, property consensusNt). Cell types with predictions for Dop, OA or 5HT that were not supported by the high-confidence experimental data listed in Supplementary Table 5 had their consensus type set to unclear, as these neurotransmitters were under-represented in the training data and independent measurements of the abundance of these transmitters did not match their prevalence in the predictions. The consensus neurotransmitters are reported in the Cell Type Explorer web resource and the Cell Type Catalogue (Supplementary Fig. 1), and form the basis for the summary data in Fig. 4.
To assess the significance of the fan-out values of cell types predicted to signal with different neurotransmitters, we conducted an ANCOVA, which combines the analysis of variance with regression analysis. We used the Python package statsmodel105 to test whether the categorical variable, the neurotransmitter type, significantly affects the slope of the linear regression (Fig. 4i).
The column pins we have built for the medulla, the lobula and the lobula plate provide a framework for quantifying the size of visual system cells by measuring the number of columns a neuron has synapses in as a function of depth (Fig. 5 and Supplementary Fig. 1). We did this in two different ways. A direct method, which is used in Fig. 5b and the Cell Type Catalogue (Supplementary Fig. 1), takes advantage of the pin points stored in neuPrint to assign synapses to depths along each pin, and this method is described in the section ‘Summary of connectivity and size by depth’. We also wanted to summarize the size of neurons in each neuropil with a single number, but simply summing the column assignments of all synapses across depth led to overestimates of cell size that did not match our expectations. We therefore implemented a trimming method, explained below, that was used as the basis of the size and coverage analysis in Fig. 5d–f, Extended Data Fig. 10 and the Cell Type Explorer web resource.
The trimming procedure was implemented to solve a problem we frequently encountered: columnar neurons like L1 or Mi1 in the medulla have a clear home column (the column with the largest synapse count summed over depth), but a few synapses were often sprinkled away from their home column. As a result, when summed over depth, the direct column count would typically be larger than we intuitively expect (for example, columnar neurons should be of size about 1 in units of columns). To correct for this overestimation, we trimmed these excessive synapses using the following steps:
After trimming, we counted columns and then averaged these distributions across neurons of the same cell type.
Spatial-coverage metrics were calculated per neuron type for each major optic lobe neuropil (that is, the medulla, the lobula and the lobula plate) (Fig. 5). Metrics were calculated separately for neurons from the same neuron type depending on the hemispheric location of their somata by querying the neuPrint database for their instance (for example, aMe12_L or aMe12_R). Individual synapses were assigned to columnar hexagonal coordinates (see the section ‘Defining column centre lines and ROIs’) using their assignment in the neuPrint database. We used the trimming procedure (see above) to summarize the cell size in column units or, conversely, the number of cells per column. In all other cases, we used the direct column occupancy data.
The spatial patterns are represented on the hexagonal eye map introduced in Fig. 3a as heatmaps of the number of cells and synapses per column. Raw, untrimmed column occupancy data were used to summarize the number of synapses per column, whereas the trimmed data were used when plotting the number of cells per column (Fig. 5d and the Cell Type Explorer web resource). The number of synapses per column reflects the sum of both presynapses and postsynapses in that column. Conversely, when calculating the number of synapses across all neuron types in a given optic lobe neuropil (Fig. 3e), only postsynapses were included to avoid double counting presynapses and postsynapses at the same connection. The maximum colour scale value was set as the 98th percentile value of the highest value across the medulla, the lobula and the lobula plate for both plots (Cell Type Explorer web resource).
We quantified the cell size (Fig. 5e, Extended Data Fig. 10 and Cell Type Explorer web resource) as the median number of columns innervated by neurons of the type in a designated optic lobe neuropil after synapses had been trimmed per neuron based on the trimming procedure described in the section above.
To examine the spatial overlap between individual neurons of the same type, we calculated the coverage factor (Fig. 5e,f, Extended Data Fig. 10 and Cell Type Explorer web resource) for each optic lobe neuropil. This metric was calculated as the mean number of neurons that contribute synapses to a single column across all occupied columns of the specified optic lobe neuropil after trimming using the abovementioned method.
To assess the proportion of total columns innervated by a neuron type, we calculated the ‘columnar completeness’ per neuropil for each type to describe the proportion of total columns in each optic lobe neuropil that are occupied by synapses from all neurons of the type (for this calculation, we used raw column occupancy data without trimming). This metric is provided as a count of innervated columns in Fig. 5f and Extended Data Fig. 10 and as the proportion of total columns (0–1) in the Cell Type Explorer web resource.
The extent to which neuron types densely or sparsely innervated a particular optic lobe neuropil was investigated by comparing the total number of columns innervated by neurons of that type, related to the ‘columnar completeness’ described above, and the columnar area covered by all neurons of the type. For most cell types, the columnar area was found by fitting a convex hull around the hexagonal coordinates based on their assignment in neuPrint and calculating its area. For the cell types in which the convex hull was a poor approximation of the area covered, we instead counted the innervated columns. This included aMe2, aMe10, AN27X013, AN09A005, Cm-DRA, MeLo11, MeTu4f, MeVP15, MeVP20, MeVPMe8, Mi16, R7d, R8d, TmY19b and LC14b in the medulla, LC14a-1, LC14a-2, LC14b, LC31a, Li37, LoVC17, LoVP12, LoVP26, LoVP49, LoVP92, LPT31, LT80, LT81 and TmY19b in the lobula, and LPT31, LC14b and LPT100 in the lobula plate. The columnar area metric (Fig. 5f, Extended Data Fig. 10 and Cell Type Explorer web resource) enabled us to quantitatively distinguish cell types that densely covered fractional parts of a neuropil from types that sparsely covered the entire neuropil.
To produce the synapse distribution by depth, featured prominently in the Cell Type Catalogue (Fig. 5 and Supplementary Fig. 1), we first identified all synapses of each target cell from the designated cell type. Using a k-dimensional tree, we identified the nearest neighbouring column pin by Euclidean distance for each presynapse and postsynapse. The depth property of the column pin associates each synapse with one of the 121 medulla, 76 lobula or 51 lobula plate depth bins (see the section ‘Defining column centre lines and ROIs)’. Across all neurons of a cell type, we calculated the mean count separately for presynapses and postsynapses per depth. We smoothed the distribution per optic lobe neuropil with a Savitzky–Golay filter (window size of 5 and first-order polynomials) before plotting on the left-side panel of the summary data figures. Separately, we provide the percentage of synapses located in the AME over the total number of synapses of a cell type, which are again separated by presynapses and postsynapses.
To quantify the size of each cell type as a function of depth, we identified the depth for all synapses. As columns are implemented as ROIs in neuPrint (see the section ‘Connectome data access overview’), each synapse comes with an associated column. For each cell type, we calculated the mean count of columns with synapses (combining presynapses and postsynapses) per depth and smoothed the distribution per optic lobe neuropil with a Savitzky–Golay filter (window size of 5 and first-order polynomials) before plotting on the right-most panel of the summary data.
The centre panel of the cell-type summary contains a connectivity summary. For all neurons of a target cell instance (effectively type, but separately accounting for right and left instances), we found all synapses and their connecting partner cells. After removing unnamed segments and connections between neurons with a mean count ≤ 1.0, we ordered them by the fraction of input and output connections and show the top five.
To test whether the 68 medulla onIN cell types with more than 10 cells per type (11,102 neurons) mentioned in the section ‘Connectivity-based cell clustering’ (Extended Data Fig. 3) could be split into cell types by their morphology alone, we assigned each neuron a feature vector of length 244 (Fig. 5 and Extended Data Fig. 8). The features captured the counts of presynapses and postsynapses and their size distributions across depths of the medulla, similar to the first and third columns in Fig. 5b, but for individual neurons instead of cell types (and for the medulla only). Moreover, the number of innervated columns was split into presynapse and postsynapse innervations and was calculated directly from the pins (introduced in the section ‘Defining column centre lines and ROIs’ rather than the column ROIs stored in neuPrint). We also subsampled the depth by a factor of 2 (as described in the section ‘Layer ROIs’). We used a confidence of 0.9 for the included synapses, based on the expectation that higher confidence synapses would produce more robust feature vectors, but we did not systematically explore this parameter.
The first 61 features are the number of presynapses across the depths of the medulla, normalized to the number of innervated columns of presynapses (with no trimming). This normalization meant that we multiplied the number of presynapses across depths of the medulla with the same factor Npre,size/Npre,syn, where Npre,syn equals the sum of the number of synapses across depths in the medulla, and Npre,size equals the sum of number of innervated columns across depths in the medulla. Although this normalization step is not biologically motivated, it follows the common strategy of bringing different features to the same scale to compare them. The second 61 features were similar to the first 61 but for postsynapses instead of presynapses. The third 61 features were the untrimmed number of columns innervated by presynapses (without further normalization). The final 61 features were the number of columns innervated by postsynapses. Example feature vectors for three neurons are shown in Extended Data Fig. 8a.
For the clustering step, we used the same standard library described in the section ‘Connectivity-based cell clustering’ but used Euclidean distance as the metric for comparing feature vectors. Again, we made a flat cut in the hierarchical clustering diagram to obtain 80 clusters. The corresponding confusion matrix and the completeness and homogeneity scores107 are shown in Extended Data Fig. 8b.
To facilitate comparisons of the connectivity and morphology clustering process, we present the results as identically formatted confusion matrices in Extended Data Figs. 3a and 8b. The numbers in the confusion matrices are the nonzero numbers of neurons for a given cell type in each cluster.
The rows (cell-type names) are ordered lexicographically. The columns (cluster identities) are ordered by the number of neurons in a cell type. Starting with the first cell type, we picked the first cluster as the one with the largest number of neurons of that cell type; the second cluster is the cluster with the second largest number; and we continued picking clusters until the number of neurons in each remaining cluster was 5% or less for that cell type. Then we continued picking from the remaining clusters using the second cell type with an analogous procedure as for the first cell type. The colours in the confusion matrices correspond to five nonoverlapping categories:
These categories are also described as probabilities in Extended Data Figs. 3a and 8b.
We provide a set of interactive, interlinked web pages to facilitate quick browsing of connections between all the cell types in our inventory (Extended Data Fig. 9). Each cell type is detailed on a single web page, except for the cases of bilateral neurons with both left and right instances in the right optic lobe. These cell types are described on two pages, one per instance. The web page for each cell type provides the mean presynapses and postsynapses in selected ROIs. The synapses in the medulla, the lobula and the lobula plate layers were determined by querying synapses in the specified layer ROIs (described in the section ‘Layer ROIs’) for each neuron in the optic lobe. The lamina and accessory medulla do not have layers, so the synapses were queried for the ROI. In the central brain, queries were conducted on all primary ROIs, excluding the left and right optic lobes. These synapses are then presented as the mean values across neurons of a given type in each of these ROIs.
The coverage factor, columnar and area completeness, and cell size (in columns) were quantified for each of the medulla, the lobula and the lobula plate, as described in the section ‘Spatial coverage of optic lobe neuropils for cell size, coverage factor and completeness’.
The connectivity table displayed on the web pages was generated by fetching all connecting neurons either upstream (inputs and T-bars) or downstream (outputs and postsynaptic densities) from the cell type named on the web page. It lists the total number of connections between the input and output cell type and the titular cell type (total connections), the total connections divided by the number of the cell count of the titular cell type (connections/[cell type]), and provides both the percentage and cumulative percentage of the total connection count. The table displays all connections between neurons with a mean count of >1.0。大多数单元具有长的弱连接尾巴,这些连接未显示在网页上。所有连接,包括省略的弱连接,都可以在Neuprint中找到。
可在https://reiserlab.github.io/male-drosophila-visual-system-connectome/上获得细胞类型Explorer,可作为Zenodo(https://doi.org/10.5281/zenodo.10899550)的一组静态html页面下载。
对于补充图1中的画廊图(以及整个过程中选定的神经元的效果图),我们使用了“渲染神经元的管道”部分中详细介绍的视觉片段。我们在Blender78中建立了三个相机方向,它们在面板E,D和V中分别在面板E,D和V中分别标记了三个面向赤道的赤道。在多轮手动策展上,我们选择了代表性神经元,这些神经元捕获了每种单元类型的许多特征(当有多个可供选择时)。我们选择的细胞以接近三个切片之一的主要方向选择。另一个考虑因素是选择沿这些相机视图投射的细胞,即在可能的情况下,可以在视力叶神经胶体外看到的细胞体(细胞体通常在神经胶体之外;这只是将3D体投射到2D图像上的人工体)。用于神经元投影的切片宽度随各细胞的形态而变化。对于需要较厚切片的细胞,由于层弯曲,投影的层模式受到影响,这对于在背侧和腹侧切片上呈现的神经元最突出。因此,尽管竭尽全力显示具有特征性层神经支配模式的神经元,但随附的突触摘要应用作细胞类型的特征层神经支配模式。对于少数具有三个标准切片捕获的形态的细胞,我们使用了自定义切片的组合来在背,赤道或腹侧切片视图上产生投影,这些视图忠实地传达了细胞的形态。这些自定义视图的JSON描述在“ SRC/Gallery_generation”目录中。例如,我们使用此策略来捕获MI20细胞类型的细胞类型目录的垂直细胞体过程。我们将每种细胞类型的选定神经元集称为“星神经元”, 以及用于渲染神经元预测的参数,包括所使用的切片和切片厚度(宽度),在代码存储库中的“ params/all_stars.xlsx”文件中列出(另请参见“ Connectome数据访问概述”部分)。
补充表6总结了我们用于视觉系统神经元的拆分GAL4系列的集合。大多数驾驶员线都在这里新报告,我们包括以前出版物的行21,23,26,33,34,34,35,38,44,45,45,45,48,58,58,58,87,91,108,109,另一个是在出版过程中(H. Dionne等人,手稿中的手稿)。有关这些线的构建和注释的更多详细信息如下所述。补充表6包括对每条线驱动表达式中的主要视频叶单元类型(或类型)的注释。用于表征线的图像可在https://splitgal4.janelia.org/cgi-bin/splitgal4.cgi上获得。目前可以通过同一网站请求拆分GAL4线(大部分);布卢明顿股票中心也可以找到许多。大多数剩余的线可以使用公开可用的AD和DBD偏头向进行重塑。
如前所述38,45,110生成了新报告的拆分-GAL4驱动线。简而言之,我们选择了基于GAL4线表达模式的图像(总表达模式109,111或MCFO标记的个体细胞19,112)的候选半径(AD和DBD)组合,并测试了这些组合是否可以在感兴趣的细胞中特异性细胞中驱动UAS报告基因的表达。有希望的AD – DBD组合合并为稳定的蝇库,并重新测试了表达模式。为了详细的表征,我们在低分辨率(×20物镜)中检查了大脑中总体表达模式的图像,对于大多数线条,细胞种群的其他高分辨率(×63个目标)图像,MCFO标记的单个细胞或两者兼有。大多数拆分GAL4筛选,样品制备和成像是由Flylight Project Team使用既定方法19,45,110,113和公共可用协议(https://www.janelia.org/project/project-team/flylight/protocols进行)。飞机拆分-GAL4项目已在最近的出版物114中总结了。
图7和扩展数据图中所示的图像。使用VVD Viewer115显示14和15。补充表6中包含了基础基因型(例如,使用的记者)和图像(例如,使用的客观)的详细信息(列表“图”)中包含以下缩写:MCFO-1和MCFO-7(参考文献19),20xCHR(20xUAS-CSCHRIMSON-MENGIMSON-MENGIMSON-MENTIMSON-MENTECTPP18(for in Attpp1)pjfrc51-3xuas-ivs-syt :: su(hw)attp1)和myr-smflag(用于pjfrc225-5xuas-ivs-myr :: smflag in vk00005中骨骼和LM图像均注册到模板大脑中(请参阅“ LM – EM体积对应关系”; JRC2018U)55,在VVD查看器中覆盖。右视角叶中的骨骼。
LM图像对EM细胞类型的分配是通过在多个细节上的LM和EM形态进行视觉比较来完成的。图7和扩展数据图中说明了用于LM – EM匹配的解剖学特征。14和15。补充表6列出了与单元格类型相匹配的单元格类型(补充图1)以及本文中。我们不能在每个驱动程序线和EM定义的单元格中表达的视频叶单元之间提供自信的1比1匹配。某些LM – EM匹配是针对细胞类型的组而不是单一类型的组,而有些则代表了更多的暂定候选匹配。通常,主要是通过EM连接性和/或依赖于难以评估的可用LM图像来区分的细胞类型的情况。在补充表6中标识了此类情况,如下所示:方括号中的单元格类型名称表示一组或多组单元类型中的表达,括号中的类型名称表明一组注释中的置信度较低。例如,LC31A(LC31B)意味着我们有信心在LC31A中表达驱动程序,也可能也可能是LC31B。[PM2A,(PM2B)]描述了在PM2A或PM2B中表达的驱动器,或两者兼而有之,但我们认为在PM2B中的表达比PM2B中的表达更有可能。在少数情况下,主要是为了简洁,我们在单个名称下列出了细胞类型的组,例如[TM]在尚未确定的TM细胞中表达或T4,用于在T4A,T4B,T4B,T4C和T4D中的表达。
EM细胞类型库存的完整性极大地促进了LM-EM匹配工作。性二态神经元可以对这种完整性提出局限性,但我们几乎没有发现它们的证据。大多数用于注释拆分GAL4系列的图像是雌性苍蝇,而这种EM重建是雄性视神叶。但是,大多数线路的LM图像中的几乎所有视觉系统单元格类型都可以很容易地与EM定义的单元格类型匹配,而主文本中提到的一个例外。
补充表6中的细胞类型注释旨在促进驱动线的识别,这些驱动线可能对于对特定视觉叶神经元的实验可能有用。由于在某些脱靶细胞类型中具有表达的驾驶员线对于许多实验仍然很有价值,因此我们在集合中包括了一些带有其他表达的线。我们的注释通常不包括中央大脑,VNC中的这些脱靶细胞类型,在某些情况下,其他(次要的)视觉系统表达模式。用于注释线条的图像可在线可用(请参见上文和数据可用性部分),如果有其他表达式的详细信息对于计划的实验至关重要,则可以咨询。
为了促进男性视神叶数据集(本节中的OL)与女性Flywire FAFB数据集15,16,17,24之间的比较,我们匹配了跨数据集(扩展数据图16和补充表7)。该匹配是在OL数据集中的单元格打字完成后执行的。唯一的例外是最新的Optic Lobe数据集释放(Optic-Lobe:v1.1)中的细胞类型变化少。在某些情况下,我们决定进行这些更改的决定受Flywire数据集中的细胞类型选择的影响(请参阅“数据集的版本”部分)。用于匹配的方法总结在下面。补充表7中提供了细胞类型匹配的完整列表,并在扩展数据中进行了总结。我们注意到,这是单元类型的几乎完整但初步的匹配。我们预计,即将到来的中央大脑和左视力叶连接性数据以及Flywire中神经元注释的进步将有助于进一步验证和完善数据集之间的细胞类型匹配。
补充表7包含OL数据集中给出的单元格类型名称和Flywire中相应单元格类型的名称(或名称)。Flywire细胞类型基于以前的出版物16,24,在某些情况下,提供了两个不同类型的名称注释,每种参考都提供了一个。我们注意到,除了这些细胞类型参考文献中包含的一些Flywire细胞(例如,先前描述的Metu Neurons48的细分)外,其他的注释不包括在我们的比较中。
对于大多数单元格类型,我们将数据集之间的单元格作为一对一匹配。但是,大约有13%的类型匹配了一对一,一对多或多对多的类型。一对多的匹配是在Flywire中将单个视频叶单元类型分为多种类型的情况,而多一对一表示多种光叶类型与单个Flywire类型之间的对应关系。在扩展数据中显示了一对一比赛和一对一比赛的示例图16B。对于先前描述的类型16,24的ONIN和ONCN细胞类型,匹配的分类是指OL数据集和先前描述的Type24之间的匹配项。对于六种VPN单元格类型,将匹配分类为多到多,因为这些单元格类型可以与每个数据集中的组匹配,但是我们对这些组中各个类型之间的匹配都不信心。我们还确定了几种分类为“无与伦比”的单元格类型,它们似乎存在于一个数据集中,但另一个数据集则不存在。其中一些类型是男性特异性或特异性神经元的强大候选者,但由于某些细胞不完全重建,这两种苍蝇或技术变异性之间可能代表生物学变异性(扩展数据中的示例图16C)。
补充表7还包括每个数据集的单元格计数(分别列出的两组FlyWire类型注释计数)。先前描述的Flywire DataSet16的注释覆盖了左右脑半球上的大多数细胞,在这些情况下,我们提供了两侧的计数。该表还包括两个数据集中的神经递质预测。视频细胞类型的列出的预测是共识预测(来自Neuprint;在补充表1中提供,并在“神经递质预测”部分中进行了描述)。对于Flywire,该表列出了给定类型的神经元中最常预测的神经递质41(先前发表的注释的联合16,24)。前两个预测的神经递质被绑定的Flywire类型被标记为“不清楚”。由于某些半纤维类型在我们的研究中被重命名(为视角叶神经元提供了更多系统的名称),因此我们基于先前报道的Hemibrain -Flywire匹配匹配的补充表7中包括半纤维匹配。16。
为了匹配细胞类型,我们首先使用NBLAST来识别Flywire和OL数据集之间的形态相似的神经元,遵循先前描述的程序16,用于半纤维蛋白 - Flywire匹配。对于Flywire,我们为所有神经元使用了以前准备好的骨架17,而对于OL,我们从Neuprint下载了骨架(Release Optic-Lobe:v1.0.1)。修剪骨骼以去除小于5 µm的树枝,然后使用非刚性变换的组合从OL转化为Flywire(FAFB14.1)空间。进入Flywire空间后,它们被重采样至每µm电缆的0.5节点,以近似于Flywire L2骨骼的分辨率,然后变成点刺。然后,Nblast在前方(Flywire→OL)和反向(OL→Flywire)方向上都运行,并且使用了两者之间的最低分数。
从NBLAST分数中,我们为每个Flywire神经元提取了基于前五名的潜在OL匹配神经元的列表。每种类型的单个Flywire神经元的样本与它们在神经胶质器中的潜在命中率进行了视为,并记录了相应的细胞类型匹配。尽管两个数据集的视位叶的注册在某些地方并不完美,但这种方法足以在细胞类型级别识别候选匹配。然后将所有用于匹配的细胞类型的神经元共同审视以确认匹配,该匹配验证了数据集之间的神经元总数是一致的。尽管这种方法足以匹配跨数据集的大多数单元类型,但在少数情况下,我们还使用了连接性共群集的输出(使用Coconatfly或可可,请参见下文)来识别和确认匹配项。主要用例在形态学上是相似的ONIN和ONCN类型,主要是仅在单方面键入的案例中24中没有出现在先前发表的16中。
神经胶质场景是用共对准的OL和Flywire网格制备的。从物质化783(参考文献17)中的静态飞线网格转换为OL空间(使用对最后一步的“ LM – EM体积对应关系”中描述的男性大脑的转换)。OL神经元的细胞类型注释来自NEUPRINT(释放视线:V1.0.1)。在少数情况下,更新了匹配项,以反映Optic-Lobe:v1.1的变化(请参见上文和“数据集的版本)”。Flywire Cell-Type注释来自GitHub(https://github.com/flyconnectome/flywire_annotations)16。我们还将内在的和连接神经元(ONIN或ONCN)与前面描述的细胞类型匹配,如2024年4月24日从https://codex.flywire.ai/api/api/downa_data_neuron_neuron_types&data_version = 783下载。为了方便起见,为先前发表的细胞类型16,24准备了神经元素注释层。在写作时,参考的作者。24描述了与另一种研究16相比,更多的ONIN和ONCN细胞类型更多,但仅为Flywire中的一个视神叶提供了它们。这些场景在补充表7中为每个OL细胞类型提供了独特的URL。16和参考。24,链接的NeuroGlancer场景包括两种飞线类型。可以通过对场景的正则表达搜索来选择显示的单元格的子集。
使用NAVIS81和FAFBSEG-PY PYTHON软件包(https://github.com/navis-org/navis)进行骨架和网状处理,空间变换和NBLAST。使用CoconatFly(https://natverse.org/coconatfly)和可可(https://github.com/flyconnectome/cocoa)进行连接共聚类。代码和NeuroGlancer链接可从GitHub(https://github.com/flyconnectome/ol_annotations)获得。可以从Flywire Cave注释后端获得Flywire神经元的连接数据,例如,通过https://fafbseg-py.readthedocs.io/en/latest。
单独的团队成员独立审查了如上所述获得的初始比赛集。与最初的匹配类似,这篇评论主要依赖于通过视觉检查神经磁场场景的形态比较。对于少数类型的人,主要是在ONIN和ONCN组中很难仅通过形态来区分,我们还审查了连接模式。这是通过将聚合细胞类型与细胞类型的连接性或连接性聚类或共聚类(使用“基于连接性基于连接性的细胞聚类”部分中描述的方法的适应)进行比较来完成的。在某些情况下,咨询了聚类,因为它提供了细胞级匹配的快速概述,并包括未型细胞。总体而言,这项审查导致了较小的调整(例如,确定一些最初无与伦比的类型的未型候选匹配项,在初始匹配的“补充表7”的“注释”列中指出)。
对匹配的细胞类型的预测神经递质的比较提供了对推定匹配和神经递质预测的另一项独立评估(在两个独立的EM量中,具有独立的训练数据,但使用与前面描述的41相同的方法)。总的来说,一致性很高。我们使用保守的政策来报告OL数据集中的共识发射器预测。因此,在732个细胞类型中,有170个具有不清楚的预测(其中132个是VPN)。在其余的OL细胞类型中,有19个在Flywire中有不清楚的预测和/或没有跨数据组匹配的匹配,因此无法比较神经递质预测。一旦排除了这些细胞类型(没有双重计数),就有544种可以评估预测的细胞类型,其中503个同意(92.5%)。在41个不匹配的预测中,有8个是组胺的OL预测,该预测未包括在Flywire训练或预测中。在其余的33个不匹配的预测中,有26个是谷氨酸和Flywire预测GABA的预测(值得注意的是,对相反的分配没有不匹配的预测)。
该分析(图7)旨在量化其连接神经元的加权总和之间的大脑区域之间的连通性量。图7H中考虑的大脑区域是Opic Lobe Neuropil层(以及AME)和突出的中央大脑区域的ROI。
如果一个神经元从大脑区域A接收了输入连接并将输出连接发送到大脑区域C,我们询问神经元对A→C连通性有多大贡献。我们首先计数C中的输出连接,然后计算出A中输入连接的分数。我们将计数和分数的乘积视为该神经元对A→C连接性的贡献。例如,神经元X在区域A中具有10个上游连接,在B区中具有20个上游连接,并且区域C区具有30个下游连接,在区域D中具有15个。然后,N Neuron X对A→C的贡献为10,对于B→C,对于B→D,对于B→C,5和10的贡献为D→D。
使用视觉系统神经元组(在“细胞类型组”部分定义),我们分别分析了所有ONIN,ONCN和VPN的区域间连接性。每个都由一个连接矩阵表示。对于ONIN和ONCN分析,我们检查了层区域之间的连接性:髓质层{1,2,2,3,4,5,6,7,7,8,9和10},叶圆层{1,2,2,3,4,4,5a,5b和6}和6}和圆圆形板层{1,2,2,2,2,2,2,2,2,2,3,3,4},curlace curlaces curpiate culace corpiate cypaties compiate condipatie compaties compiate condipatie compaties compiate cypaties cypiate。对于VPN,我们分析了这21个视频叶区域和中央大脑区域之间的连通性。几个大脑区域已分为超级区域,以简化此摘要61。该区域在图7H中进行了缩写,许多区域在图7i(投影视图)中进行了以下缩写:前视神经结节(AOTU),前腹侧侧外侧脑脑(AVLP),后侧面侧外侧杂交(PLP),后脑膜proteperal protoperpere croteperper(Pvl)(PVL)(PVL)(PVL),PVLERMENSERSER;神经胶体(PENP),下神经胶体(INP),外侧复合物(LX),蘑菇体(MB),中央复合物(CX),腹膜神经膜(VMNP),Gnathal神经节(GNG),外侧角(LH)和上级神经膜(LH)和上级神经膜(SNEP)。
可用的两个Optic Lobe数据集的版本:初始版本(Optic-Lobe:v1.0.1)和数据集的当前版本(Optic-Lobe:v1.1)。Optic-Lobe:V1.1结合了对分割的更新(主要是与这些神经元重建片段的小,以前未连接的部分合并);这些变化共同导致重建完整性的较小但可检测到的增加(扩展数据表1)。我们还修改了一些细胞类型的定义(将5种类型分为11种新型,将2种类型合并为一种类型)。这些细胞类型的几个变化是基于比较数据集之间的细胞类型后进行的观察结果(请参阅“男性视线叶和Flywire数据集之间的匹配细胞类型”部分),并进一步提高了该研究和其他研究之间的细胞键入的一致性16,24,33。此外,我们更改了几种单元格类型的名称(例如,为了介绍更好地反映某些单元格对的相似性相似性的名称),并调整了某些单个单元格的键入(几乎所有这些都是R7和R8光感受器,请参见“分配R7和R8 Photorepeptors and Medulla列为Ommatidia”的“分配R7”部分。在文章中介绍的数据中,随后分析中使用的所有图层和列ROI均基于Optic-Lobe:V1.0.1数据,并且在次要更新到Optic-Lobe:v1.1之后未重新生成。图中显示的所有渲染神经元,图3B和扩展数据图中除外。8A和16B基于V.1.1网格。
补充表6中详细介绍了飞行库存的可用性。大多数拆分GAL4驱动线可在https://splitgal4.janelia.org/cgi-bin/splitgal4.cgi上找到。此外,许多线已存放在果蝇股票中心(BDSC)中。这些股票的BDSC研究资源标识符包括在表中(“ BDSC RRID”列)。对于当前尚未作为合并股票的大多数其他线路,BDSC可从BDSC获得组件AD和DBD Hemidrivers。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。