基于EHR的新模型PRIME在预测胰腺癌风险方面实现0.75 AUC,覆盖1100万患者

基于EHR的新模型PRIME在预测胰腺癌风险方面实现0.75 AUC,覆盖1100万患者

背景

胰管腺癌(PDAC)是美国最致命的恶性肿瘤之一,始终位列癌症相关死亡的主要原因之一。与PDAC相关的严峻预后——五年生存率低于12%——主要是由于疾病的侵袭性生物学特性和早期检测的挑战。大多数患者在晚期阶段才被诊断出,此时已经无法通过根治性手术切除。尽管早期检测已被证明可以显著改善生存结果,但由于PDAC在普通人群中的相对罕见性,历史上一直认为大规模筛查项目既不切实际也不经济。这种疾病致命性和低发病率之间的内在矛盾,在肿瘤学领域造成了一个重要的未满足需求:识别那些可以从强化监测或早期检测策略中受益的高风险个体。

在这种背景下,开发经过验证且具有普遍性的风险预测工具,利用现成的临床数据,提供了一条有前途的前进路径。电子健康记录(EHR)系统包含大量结构化和非结构化的信息——人口统计学、诊断代码、实验室值、药物史——这些信息可以用于构建能够标记出高于平均水平的PDAC风险个体的模型。如果将这些工具整合到临床工作流程中,可以指导有针对性的病例发现工作,优化资源分配,并最终将诊断范式转向更早期的疾病识别。

研究设计

研究团队使用Optum Labs Data Warehouse(一个纵向、去标识化的美国EHR和索赔数据库,涵盖40岁及以上且在2016年至2018年之间至少有一次门诊临床就诊的成人)开展了一项大规模队列研究。研究设计包括三个不同的队列以评估模型的普遍性:来自23个医疗系统的训练队列(n = 4,859,833)和来自31个额外医疗系统的验证队列(n = 5,619,091)。为了进行国际验证,该模型还在英国生物库(n = 498,754)中进行了测试。

预测变量包括人口统计学特征、国际疾病分类(第九版和第十版;ICD-9/10)诊断代码和常规测量的实验室值。建模方法采用了弹性网正则化和10折交叉验证来选择最简约但最具预测性的特征集。主要结局是通过ICD-9/10诊断代码识别的PDAC新发病例。模型性能通过时间依赖受试者工作特征曲线下面积(AUC)和校准指标进行评估。数据分析于2025年7月至2026年1月进行。

关键发现

综合研究人群包括超过1100万美国队列的成年人。种族和民族分布反映了更广泛的EHR景观:82.7%的白人,8.4%的黑人,4.3%的西班牙裔/拉丁裔,2.1%的亚洲人,以及2.4%的其他种族和民族群体。

在训练队列中,平均(标准差)年龄为60.4(11)岁,14,405人在平均(标准差)随访5.4(2.5)年期间被诊断为PDAC,对应发病率为每10万人年55例。验证队列显示相似的发病率,为每10万人年54例,在平均(标准差)随访3.9(2.5)年期间有11,693例PDAC诊断。

最终模型——称为PRIME(胰管腺癌早期检测风险模型)——在弹性网正则化后保留了19个预测因子。这些预测因子包括临床、实验室和人口统计学变量。值得注意的是,保留的特征包括胰腺炎病史、胃肠道疾病、既往癌症、2型糖尿病、天冬氨酸氨基转移酶(AST)水平升高、吸烟状态、非O型血和男性。模型的透明性——其依赖于可解释且常规可用的变量——使其区别于更复杂的黑箱方法,并促进了临床应用。

在36个月的预测范围内,区分性能表现良好,训练队列和验证队列的AUC均为0.75。在不同风险分层中报告的校准情况良好。在验证队列中,预测风险最高的1%个体相比平均风险患者表现出显著升高的PDAC风险(HR, 7.63;95% CI, 6.85–8.49),突显了模型识别具有临床意义风险升高的高风险亚组的能力。

在英国生物库中的国际验证结果显示36个月AUC为0.71,校准情况可接受,表明尽管存在编码系统、患者人群和数据收集方法的差异,PRIME仍能超越美国医疗保健环境的局限。

专家评论

PRIME研究代表了机器学习和EHR衍生数据在肿瘤学风险分层应用方面的显著进展。几个方法论优势值得关注。使用19个可解释预测因子的简约模型在预测性能和临床实施性之间取得了务实的平衡——这是任何旨在实际部署的工具的关键考虑因素。多队列验证策略,涵盖美国医疗系统和独立的国际数据集,提供了在预测建模研究中很少达到的普遍性证据。

保留的易于获取的变量——包括基本的人口统计学、诊断代码和常见的实验室值——意味着PRIME可以在无需专门测试或侵入性程序的情况下在护理点计算。这与新兴的基于血液的早期检测分析物形成对比,后者虽然前景广阔,但在低患病率人群中面临成本、可及性和假阳性率的挑战。

然而,有几个考虑因素需要谨慎解读。首先,虽然0.75的AUC代表有意义的区分度,但尚未达到通常认为足以进行人群筛查的阈值。作者恰当地指出,PRIME并非旨在替代人群筛查,而是识别高风险亚组以进行有针对性的监测或进一步检查。其次,依赖ICD诊断代码引入了潜在的误分类偏差,因为编码准确性因机构和临床环境而异。第三,EHR衍生的种族和民族数据可能不完整或记录不一致,这可能影响在代表性不足的人群中的模型性能。第四,英国生物库虽然是外部验证的宝贵资源,但代表了一个具有固有选择偏差的志愿者队列,该队列中的性能指标可能无法完全转化为常规临床人群。

未来的研究方向应包括前瞻性评估EHR引导的病例发现工作流程,与新兴的基于血液的早期检测生物标志物(如循环肿瘤DNA或蛋白质谱)的整合,以及评估PRIME驱动的识别是否会导致有意义的分期迁移和临床实践中生存结果的改善。

结论

PRIME模型代表了一种使用常规收集的EHR数据对PDAC进行风险分层的透明、可解释且具有普遍性的方法。它在两个美国验证队列和英国生物库中均表现出强大的区分能力,结合在预测风险最高的1%个体中观察到的具有临床意义的风险升高,使其成为有针对性的早期检测策略的有希望的工具。虽然需要前瞻性研究来确定EHR引导的病例发现的临床影响,但PRIME提供了一个可扩展的框架,可以显著改变胰腺癌诊断的范式,从症状出现向更早、更可治疗的疾病阶段转变。

资金来源

研究在可用摘要中未报告具体资金信息。读者可参考JAMA Oncology中的全文以获得完整的利益冲突和资金披露。

参考文献

Mavromatis LA, Zlatanic V, Agarunov E, Sanoba SA, Kluger MD, Horwitz LI, Razavian N, Maitra A, Gonda TA, Grams ME. Development and Validation of a Parsimonious Risk Stratification Model for Pancreatic Cancer. JAMA oncology. 2026-03-26. PMID: 41885821.

Comments

No comments yet. Why don’t you start the discussion?

发表回复