亮点
- Neuropath-AI在96%的样本中实现了家族级别的分类,在87%的测试队列中实现了终端级别的预测。
- 与DNA甲基化参考标签相比,该模型对特定CNS肿瘤类型的Top-1准确率为80%,Top-2准确率为86%。
- 本研究表明,深度学习可以直接从标准组织病理学全片图像中成功推断复杂的分子特征。
- 这项技术提供了一种可扩展、临床适用的辅助工具,以提高全球CNS肿瘤诊断的效率和准确性。
连接组织学与分子诊断的桥梁
2021年世界卫生组织(WHO)对中枢神经系统(CNS)肿瘤的分类已经从根本上改变了仅依赖形态学评估的诊断范式,转向了高度依赖分子特征的综合方法。尽管DNA甲基化分析目前是分子分类的金标准,但其临床应用往往受到高成本、长周转时间和需要专门基础设施的限制。这在全球神经肿瘤学护理中造成了显著的“分子差距”。
为了解决这一问题,研究人员转向了人工智能。通过利用深度学习和计算机视觉,现在可以从标准苏木精和伊红(H&E)染色切片中直接推断出分子特征,如染色体改变、突变和甲基化模式。本研究评估了Neuropath-AI,这是一个基于分子推断的分层系统,旨在以分子检测的精度进行CNS肿瘤分类,同时具备常规组织学的速度和可及性。
研究设计与方法
在这项多机构、回顾性研究中,研究人员使用大量全片图像(WSIs)数据集开发并验证了Neuropath-AI。训练阶段涉及来自国家癌症研究所(NCI)、儿童脑肿瘤网络(CBTN)和数字脑肿瘤图谱的5,835个样本。该模型被训练以识别52种不同的肿瘤类型,涵盖了临床实践中遇到的大多数胶质瘤、胚胎性肿瘤以及脑膜或间叶组织肿瘤。
测试队列
该模型的性能在另一个由5,516个样本组成的独立队列中进行了严格测试,这些样本在2024年至2025年间从四个主要中心(NCI、西北医学、匹兹堡大学医学中心和伦敦大学学院)确定。队列按性别平衡(50%女性,50%男性),中位年龄为43岁。所有诊断的参考标准均为基于DNA甲基化的分类,确保了最高的真实准确性。
统计终点
主要目标是在两个级别上测量分类准确性:广泛的“家族”级别(例如,胶质瘤与胚胎性肿瘤)和具体的“终端”分类。共同主要终点包括样本覆盖率(置信度阈值以上的样本百分比)和平衡准确性,后者考虑了某些肿瘤类型的罕见性。
关键发现:高准确率和临床覆盖率
验证研究的结果强调了Neuropath-AI作为诊断辅助工具的潜力。该模型表现出高覆盖率,在5,516个样本中的96%成功达到了家族级别的分类。当推至至少中等置信度的终端级别分类时,该模型为87%的队列提供了预测。
预测性能
在4,772个达到终端分类置信度阈值的样本中,最高得分的单一预测(Top-1)与DNA甲基化参考标签匹配的样本比例为80%(3,817个样本;95% CI 79–81)。平衡准确性(反映52个类别中每个类别的表现,无论样本频率如何)为66%(95% CI 63–70)。
当考虑Top-2预测时,准确性上升到86%(4,103个样本;95% CI 85–87),平衡准确性为75%。这些数据表明,在绝大多数情况下,AI助手要么立即识别出正确的肿瘤类型,要么将其置于前两个鉴别诊断中,为病理学家提供了强大的安全网。
专家评论:临床意义
Neuropath-AI能够从形态学中推断分子特性,是一项重要的技术里程碑。虽然它不能替代金标准的DNA甲基化分析,但它可以作为一个快速筛查工具。在无法进行分子检测的环境中,它可以提供以前不可能达到的诊断深度。在资源丰富的环境中,它可以优先考虑进一步检测的病例,标记潜在的人为错误,并大幅缩短综合诊断的时间。
研究的一个局限性是其回顾性性质。尽管大型多机构队列提供了强有力的证据,但仍需要前瞻性研究来评估该模型在实时临床工作流程中的表现。此外,66%的平衡准确性表明,虽然常见肿瘤的识别非常精确,但罕见亚型仍然是AI的挑战,就像对人类专家一样。
结论
Neuropath-AI系统代表了精准神经肿瘤学民主化的重要一步。通过从标准组织学切片中提供分子水平的见解,它提供了一条提高诊断准确性和效率的途径。随着该模型的公开可用,其在未来前瞻性试验中的实施可能会重新定义病理学家的角色,从手动观察者转变为高级AI驱动数据的整合者。
资金与参考文献
本研究由美国国立卫生研究院(NIH)内部研究计划资助。
参考文献:Lalchungnunga H, Dampier CH, Singh O, 等. 基于分子推断的分层深度学习系统在CNS肿瘤诊断中的分类准确性:一项多机构、回顾性研究。Lancet Oncol. 2026年2月;27(2):243-253。doi: 10.1016/S1470-2045(25)00661-8。PMID: 41643698。

