精准肿瘤学与人工智能:数字病理学中祖先相关变异对EGFR预测的影响

精准肿瘤学与人工智能:数字病理学中祖先相关变异对EGFR预测的影响

亮点

  • 开源AI病理模型在从H&E切片直接预测EGFR突变方面显示出有希望的AUC值(最高达0.83),可能加速临床决策。
  • 不同祖先群体之间存在显著的性能差异,亚洲血统患者的表现明显较差(AUC 0.68),而欧洲(AUC 0.84)或非洲(AUC 0.85)血统患者的表现较好。
  • 组织背景仍然是关键变量,AI在胸膜标本中的表现显著下降,相比之下原发肺组织样本中的表现更好。
  • AI引导的分诊有可能减少高达57%的快速分子检测需求,优化精准肿瘤学中的资源分配。

背景

肺癌腺癌(LUAD)的管理因发现可靶向的致癌驱动基因而发生革命性的变化,最显著的是表皮生长因子受体(EGFR)的突变。这些突变的识别对于启动酪氨酸激酶抑制剂(TKI)治疗至关重要,与传统化疗相比,显著改善了生存结果。然而,传统的分子检测方法,如下一代测序(NGS)和聚合酶链反应(PCR),通常涉及较长的周转时间(1-3周)并需要大量的组织量,这可能会延迟挽救生命的治疗的启动。

人工智能(AI),特别是基于全切片图像(WSIs)的深度学习模型,已经作为一种颠覆性解决方案出现。这些模型旨在识别人类肉眼难以察觉的形态学模式,这些模式与特定的基因组改变相关。尽管早期的概念验证研究表明“图像到突变”预测的可行性,但一个关键的未满足需求仍然存在:确保这些模型在不同的全球人口和各种临床标本类型中具有鲁棒性、通用性和公平性。

主要内容

AI在肺癌病理学中的发展历程

基于AI的突变预测之旅始于基础研究(例如,Coudray等,2018年),这些研究表明卷积神经网络(CNNs)能够区分LUAD和鳞状细胞癌,并以中等准确性预测常见的突变如EGFR和KRAS。随后,多个“黑箱”和可解释模型被开发出来。最近,研究重点已从单一机构内的内部验证转向大规模的多机构外部验证。Rakaee等(2026年)的研究代表了这一进展中的一个重要里程碑,超越了简单的准确度指标,探讨了模型性能的社会生物学决定因素,特别是遗传祖先。

按模型架构和性能的证据

当前的证据基础涉及两个主要的开源AI病理模型。在丹娜法伯癌症研究所(DFCI)队列(n = 1759)中,一个模型在预测EGFR状态方面表现出色,AUC值为0.83(95% CI,0.81-0.85),而第二个模型的AUC值显著较低,仅为0.68。这种差异突显了训练架构和训练数据多样性对模型鲁棒性的影响。在欧洲TNM-I验证队列(n = 339)中,这些模型保持了相对一致的性能(AUC分别为0.81和0.75),表明在西方人群中具有一定的地理通用性。

按遗传祖先的性能差异

近期文献中最显著的发现之一是按遗传祖先分层的患者性能的变异性。使用胚系基因型数据推断祖先,研究人员发现高表现模型在欧洲(AUC 0.84)和非洲(AUC 0.85)亚组中保持高准确性。然而,在亚洲血统亚组中观察到了显著的下降(AUC 0.68)。鉴于EGFR突变在亚洲人群中最为普遍(高达50%的LUAD病例),这一差异尤为令人担忧。这表明EGFR突变的形态学表现可能因祖先背景而异,或者主要是欧洲来源的训练集未能捕捉到亚洲患者的细微特征。

方法学挑战:标本类型和分诊效用

AI模型的临床效用还取决于标本来源。对样本类型的分析显示,模型在肺组织标本上的表现最佳(AUC 0.86),但在胸膜标本中的表现显著下降(AUC 0.66)。这可能反映了转移灶与原发肿瘤在间质环境和细胞组成上的不同,这些差异可能掩盖了AI依赖的形态学线索。

尽管存在这些限制,AI模型在临床分诊中仍具有高潜力。通过实施高置信度阈值的AI预测,临床医生可以潜在地绕过57%的患者的快速EGFR检测,同时保持0.99的特异性。这种“分诊阳性”方法确保只有最有可能的候选者优先进行快速分子检测,为更复杂的病例节省成本和时间。

专家评论

Rakaee等的研究既凸显了将AI整合到肿瘤学中的前景,也揭示了其潜在风险。从临床角度来看,能够在几分钟内从常规H&E切片中预测EGFR状态是一项非凡的进步。然而,与祖先相关的变异性是一个关键的“红旗”。如果AI模型在亚洲患者中的准确性较低——而这正是最有可能受益于EGFR靶向治疗的群体——其部署可能会无意中加剧现有的医疗保健不平等。

从机制上讲,亚洲队列和胸膜样本中的低表现表明,AI模型可能正在学习与肿瘤微环境或特定组织学亚型(如鳞状生长模式与实性生长模式)相关的特征,这些特征在不同人群中的EGFR突变相关性不同。专家建议,未来模型开发必须优先考虑“祖先意识”训练,利用来自全球生物库的大规模、多样化的数据集,确保公平的性能。此外,胸膜样本中性能的下降表明,模型需要专门针对转移灶的形态进行调优,而不是依赖于“一刀切”的肺癌算法。

结论

基于AI的病理工具代表了肺癌EGFR预测的变革性辅助手段,提供了一条快速分诊和减少分子检测负担的途径。然而,当前模型在遗传祖先和标本来源方面表现出显著的性能差距。未来的研究必须专注于多样化训练数据集,包括更广泛的祖先代表性,并优化适用于不同组织背景的模型。在这些差距得到弥合之前,AI应被视为初步筛查工具——“数字分诊”——补充而非替代金标准分子检测。追求精准肿瘤学必须确保AI工具的“精准性”在所有患者群体中均等分布。

参考文献

  • Rakaee M, Nassar AH, Tafavvoghi M, et al. Ancestry-Associated Performance Variability of Open-Source AI Models for EGFR Prediction in Lung Cancer. JAMA Oncol. 2026;12:e256430. doi:10.1001/jamaoncol.2025.6430. PMID: 41678173.
  • Coudray N, Ocampo PS, Sakellaropoulos T, et al. Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning. Nat Med. 2018;24(10):1559-1567. PMID: 30224741.
  • Echle A, Rindtorff N, Brinker TJ, et al. Deep learning in cancer pathology: a new frontier for precision oncology. Cancer Cell. 2021;39(2):164-167. PMID: 33592176.

Comments

No comments yet. Why don’t you start the discussion?

发表回复