长期以来,“人工智能”一词一直与未来技术的概念联系在一起,这种技术可以极大地扩展研究和技术开发的能力。 自 20 世纪 50 年代以来,人工智能就已经存在,并从诞生伊始就得到广泛使用。 广义地说,人工智能 (AI) 是指任何能使机器模仿人类智能的技术。 人工智能可以进一步归类为一种更先进的技术,称为“机器学习”,它采用统计方法,使机器能够从数据中学习任务,而无需显式编程。 人工智能的最高级形式被称为“深度学习”,它使用包含许多层的神经网络,这些层能够直接从复杂的数据集学习表征和任务。 深度学习已经变得如此强大,以至于它经常能够在图像分类的准确度上胜过人类。
图 1. 人工智能发展时间线。
AI(更具体地讲,深度学习)可以轻松地应用于显微镜分析,使研究人员能够以更高的准确度及在更短的时间内对其数据进行更可靠的分析。 奥林巴斯的 TruAI™ 技术中的神经网络是卷积神经网络,它提供的对象分割技术在分析复杂或具有挑战性的数据集时具有高适应性。 这些网络可以评估各种类型的输入数据或证据,并对这些数据做出决策,这项任务在人工执行时通常会受到潜在人类偏见的影响。 本应用说明展示了一个真实示例,说明了 TruAI 技术为何有利于对小鼠大脑中 c-Fos 阳性神经元进行自动分割分析,尤其是在与不够先进的 AI 工具相比的情况下。
在这个实验中,研究人员需要量化大脑海马区(大脑中负责记忆和学习的区域)中 c-Fos 阳性神经元的表达,以评估神经发生中断的系统性后果。 C-Fos 是一种原癌基因,其表达可用作神经元活性的标志。 传统的强度/形态分割方法对于生成可靠的数据集无效或缺乏效率,因为数据集显示的背景和目标强度水平各不相同,这使手动分析尝试变得复杂(图 2),需要对结果进行耗时的审核以消除误报。
图 2. 需要分割分析的数据集类型示例: 在 c-Fos 启动子下表达 tdTomato 的转基因小鼠整个海马区的拼接图像(左),以及说明拼接图像中 c-Fos 信号变化性和图像背景水平的单个图像(右)。 使用 10X SAPO 和 2 倍变焦在 1 AU 下采集的 1k × 1k Z 堆栈图像。
TruAI 技术的神经网络 (NN) 训练方案首先需要一个“训练”数据集,用于为进一步的识别和分析规定基本事实。 这一基本事实可以基于用户对原始数据的注释,也可以由 cellSens 软件的强度/形态阈值设定和分割功能自动生成。 通过这一初始数据输入,TruAI NN 可以在迭代训练期间学习并利用实验数据集,而不需要用户的额外输入。 建立这种基本事实使 TruAI NN 能够集中于真实(目标)与非真实(非目标)之间的对比。 在本实验中,使用了八个包含不同水平 c-Fos 表达的数据集来训练 TruAI NN(图 3)。 基于这些数据集,TruAI NN 进行了一次包括 40,000 次迭代的可靠训练,以生成将用于分析所有后续图像的 NN。 在迭代训练过程中,监控了从初始训练集中选择的验证图像,并将其用于比较。
图 3. 用于生成 TruAI 神经网络 (NN) 的训练数据集: 使用了表达水平不同的八个数据集来描绘对象(红色)与背景(灰色)。
生成经过训练的 TruAI NN 后,将其用于对剩余数据集进行批处理和分析。 图 4 显示了使用生成的 TruAI NN 执行的概率图和后续分割分析。 使用 TruAI NN,根据概率层对数据集进行了分割,并对其自动运行了 cellSens 的自动分割和分类算法,以产生基于平均强度、总强度和面积的 c-Fos 阳性细胞的定量指标。 cellSens 软件中的宏管理器功能可对所有剩余数据集进行批处理。
图 4. 使用 NN 进行阈值设定和分割: FV3000 显微镜采集的 c-Fos 阳性细胞图像(左)、NN 生成的 c-Fos 阳性细胞概率图(中)以及基于概率层的 c-Fos 阳性细胞分割(右); 数据根据平均强度、总强度和面积进行了自动分割和分类。
如前所述,在图像分析中使用深度学习技术的好处在于,与其他 AI 程序相比,它能够更可靠地识别对象。 在本实验中,TruAI 深度学习技术使用了八个经过 40,000 次迭代的数据集,以生成用于对其余数据集做进一步分析的 NN。 使用这种可靠训练方案的优点是,当图像不够理想(例如,背景较高,以及目标表达较低)时,它使 NN 能够更准确地识别对象。 这一优势如图 5 所示,其中将 TruAI NN 的性能与仅基于一个训练数据集的训练强度较低的网络进行了比较。 在较高的表达水平上,两种算法识别出的细胞数量相同。 但在表达水平非常低的情况下,训练强度较低的网络将 c-Fos 阳性细胞的数量严重高估了近一倍,这会显著影响实验得出的结论。 TruAI 深度学习技术成功地处理了不同级别的背景和 c-Fos 强度以提供更准确的结果,而无需手动审核数据以消除误报。
图 5. 训练强度不足网络与 TruAI 神经网络的 c-Fos 阳性识别率比较; 橙色条表示使用训练强度不足的网络对单一数据集进行 2,000 次迭代后得到的结果,蓝色条表示使用 TruAI NN 对八个数据集进行 40,000 次迭代后得到的结果。
关于我如何看待 AI 方法对科学研究的益处,有几个因素。 在讨论这种系统时,我发现自己会反复提到的一个要点是,它有助于我们在量化图像时消除实验者的偏见,因为即使出于某种原因,我们不能对实验条件视而不见,我们也不能决定实际的实验组织是否为标记细胞。 撇开偏见不谈,它还有助于减少不同实验者和实验室实验之间的可变性,并最终提高数据的可重现性。 我认为这种方法是一种重要途径,有助于确保我们采取措施解决当今困扰科学界的可重现性问题。 |
致谢
本应用说明由以下研究人员协助编写:
卡尔加里大学 Jonathan Epp 博士
Please adjust your selection to be no more than 5 items to compare at once
对不起,此内容在您的国家不适用。
您即将被转换到我们的本地网站。