亮点
– 国际回顾性队列研究(SENIOR 注册表)使用人工神经网络(ANNs)预测接受根治性放化疗的≥65岁局部晚期 HNSCC 患者的总生存期(OS)和无进展生存期(PFS)。
– 模型实现了中等的区分能力(OS ROC-AUC 0.68,PFS ROC-AUC 0.64),并确定人乳头瘤病毒(HPV)状态、估算的肾小球滤过率(eGFR)、东部肿瘤协作组(ECOG)表现状态和淋巴结分类为主要影响特征。
背景
头颈部鳞状细胞癌(HNSCC)是一种主要影响老年人的疾病。这一人群在合并症、功能储备和治疗耐受性方面具有异质性,但在随机试验中老年患者代表性不足。因此,临床医生经常需要在没有强有力的年龄特异性证据的情况下个体化根治性放化疗决策。
整合常规可用临床变量的预测模型可以协助共同决策、调整强度和分配支持资源。机器学习(ML),包括人工神经网络(ANNs),有望检测传统回归可能遗漏的非线性关系和交互作用。然而,在实际应用之前,模型性能、可解释性、外部验证和临床效用仍然是关键障碍。
研究设计
Marschner 等人报告了一项国际回顾性队列研究(SENIOR 注册表),该研究开发并外部验证了两个 ANN 模型,以预测接受根治性放疗和同期系统治疗的≥65岁局部晚期 HNSCC 老年患者的 OS 和 PFS(2005-2019 年间)。关键纳入标准包括:年龄≥65岁、局部晚期 HNSCC、根治性放化疗。排除标准包括诱导或辅助化疗、既往头颈部癌症或治疗开始时的转移性疾病。数据来自德国、瑞士、捷克共和国、塞浦路斯和美国的 19 个学术中心。病例收集时间为 2005-2019 年;数据整理时间为 2021-2023 年。分析时间为 2023 年 12 月至 2025 年 4 月。
训练和测试集划分:对于 OS,训练集 738 例,测试集 160 例(总计 n=898)。对于 PFS,训练集 770 例,测试集 175 例(总计 n=945)。模型通过 ROC 曲线下面积(AUC)和精确率-召回率 AUC 进行评估;特征重要性和可解释性通过 Shapley 加性解释(SHAP)值进行评估。患者根据模型输出的中位数阈值被分为高风险和低风险组。
主要发现
人群特征:中位年龄 71 岁(四分位距 68-76);约三分之二为男性(74%)。队列包括接受根治性放疗加同期系统治疗的患者;HPV 状态在可用时被纳入。
模型性能
– 总生存期 ANN:外部测试队列中的 ROC-AUC 为 0.68(95% CI,0.60-0.76)。该模型将患者分为高风险和低风险组,生存差异具有统计学意义。
– 无进展生存期 ANN:测试集中的 ROC-AUC 为 0.64(95% CI,0.56-0.72)。
– 报告了精确率-召回率 AUC 以解决类别不平衡问题;数值未在摘要中突出显示,但用于补充区分指标。
最重要的预测特征
SHAP 分析确定了模型中最主要的预测因子:人乳头瘤病毒(HPV)状态(在口咽癌中具有强烈的预后意义)、由 eGFR 测量的肾功能、ECOG 表现状态和淋巴结分类(N 期)。这些特征与临床知识一致:HPV 阳性的口咽癌预后较好,基线功能状态和器官功能影响治疗耐受性和竞争性死亡率,淋巴结负担与复发风险相关。
风险分层和潜在临床用途
使用模型输出的中位数作为二元截止点,ANN 将患者分为具有不同生存轨迹的组。作者建议这些模型可以支持治疗个性化——例如,识别高竞争性死亡风险的患者,这些患者可能适合治疗降级或增强的支持护理,或识别低风险的老年患者,他们可以合理地耐受标准的根治性放化疗。
专家评论:解读、优势和局限性
该研究通过关注老年 HNSCC 患者并使用多中心数据进行开发和外部测试,解决了临床上有意义的空白。几个方面增强了其贡献:
- 国际多中心数据增加了异质性,相比单中心模型提高了潜在的通用性。
- 使用外部测试集而非仅内部交叉验证,是朝着无偏性能评估迈出的关键一步。
- 通过 SHAP 提供的模型可解释性提供了可解释的特征贡献,便于临床医生评估模型行为。
然而,关键的局限性限制了立即临床应用的热情:
- 中等区分能力:OS 的 ROC-AUC 为 0.68,PFS 的 ROC-AUC 为 0.64,表明在个体水平上分离结果的能力仅属中等。对于临床决策,特别是当决策涉及重大病态时,通常需要更高的区分能力和证明的净益处。
- 校准和临床效用:摘要报告了区分指标,但未提供校准图或决策曲线分析。具有可接受区分能力的模型仍可能错误估计绝对风险,导致次优的临床建议。
- 回顾性设计和潜在的信息偏差:2005-2019 年的数据包括分期、HPV 检测实践、放疗技术(IMRT 采用)和系统治疗(如西妥昔单抗与铂类药物,免疫治疗的发展)的时间变化。治疗方案的异质性和细微变量(剂量强度、中断、社会决定因素)的不完全捕捉可能会影响模型性能和可移植性。
- 缺乏老年特异性测量:老年患者结局的关键决定因素——全面老年评估领域(如认知、行动能力、营养、社会支持和多重用药)——未被强调。现有的老年肿瘤学工具(CARG 毒性评分、老年评估)提供的信息超出了表现状态和实验室值,并可能改善个体化预测(Hurria 等,2011;Mohile 等,2018)。
- 竞争风险和特定原因结局:老年人因非癌症原因有显著的竞争性死亡率。预测 OS 的模型可能需要使用竞争风险方法来区分癌症相关死亡和其他原因的死亡,这对专注于疾病控制与寿命的治疗决策有直接影响。
- 对决策和结局的影响未知:核心问题是 ANN 支持的决策是否能改变管理并改善以患者为中心的结局(生存、生活质量、治疗毒性)。需要前瞻性影响研究或随机对照试验来证明临床益处并检测意外伤害。
这些模型如何融入当前实践
针对老年人的预测工具应补充而不是替代全面的临床评估。当前的老年肿瘤学指南建议结合老年评估来识别脆弱性并指导管理(例如,ASCO 指南)。基于常规临床变量训练的 ANN 可以作为一个易于访问的初步筛查工具,标记出需要进行全面老年评估、试验入组或早期姑息治疗转诊的患者。
考虑整合这些模型的临床医生和机构应要求透明的模型输入、预处理、缺失数据处理、本地人群校准以及解释不确定性的用户友好界面。工作流程整合还必须尊重患者价值观并确保共同决策,尤其是在模型建议降级治疗时。
下一步和研究重点
为了将这些 ANN 转化为实践,建议采取以下步骤:
- 在多样化的临床环境中进行前瞻性验证,使用最新的治疗方案和完整的老年变量。
- 进行校准评估,如有必要,进行本地重新校准以保持准确的绝对风险估计。
- 进行决策曲线分析和临床影响研究,以评估净益处和以患者为中心的结局。
- 与老年评估工具和生物标志物(如炎症标志物、虚弱指数)集成,以提高区分能力和临床相关性。
- 进行伦理和实施研究,解决透明度、临床医生接受度和避免算法偏差(例如,跨人口群体的性能差异)。
结论
Marschner 及其同事开发并外部测试了 ANN,这些模型在老年局部晚期 HNSCC 接受根治性放化疗的患者中中等地区分了 OS 和 PFS。重要的预测因子(HPV、eGFR、ECOG、淋巴结分期)证实了临床直觉并支持模型的表面效度。然而,中等的 AUC 值、未报告的校准和决策曲线指标、回顾性设计和有限的老年特异性细节意味着这些模型是假设生成的,而不是准备好常规临床部署的。
在将这些 ANN 推荐为这一易感人群的决策支持工具之前,需要进行良好的前瞻性验证、与老年评估的整合和影响评估。在此期间,这些模型提供了一个有前景的框架,可以更精确地进行风险分层,并优先对患者进行全面老年评估和个性化治疗计划。
资金和临床试验注册
资金:未在提供的摘要中报告。请参阅原始的 JAMA Otolaryngology—Head & Neck Surgery 文章以获取完整的资金披露。
ClinicalTrials.gov:不适用;回顾性注册研究。
参考文献
1. Marschner SN, Lombardo E, Haehl E, et al. Outcome Prediction in Older Adults With Head and Neck Cancer Undergoing Chemoradiation. JAMA Otolaryngol Head Neck Surg. 2025 Nov 6:e253840. doi:10.1001/jamaoto.2025.3840.
2. Hurria A, Togawa K, Mohile SG, et al. Predicting Chemotherapy Toxicity in Older Adults With Cancer: A Prospective Multicenter Study. J Clin Oncol. 2011;29(25):3457–3465.
3. Mohile SG, Cesari M, Hurria A, et al. Practical Assessment and Management of Vulnerabilities in Older Patients Receiving Chemotherapy: ASCO Guideline. J Clin Oncol. 2018;36(22):2326–2347.
4. Collins GS, Reitsma JB, Altman DG, Moons KG. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): The TRIPOD Statement. Ann Intern Med. 2015;162(1):55–63.
5. Lundberg SM, Lee SI. A unified approach to interpreting model predictions. arXiv:1705.07874. 2017.
6. Pignon JP, le Maître A, Maillard E, Bourhis J; MACH-NC Collaborative Group. Meta-analysis of chemotherapy in head and neck cancer (MACH-NC): an update on 93 randomized trials and 17,346 patients. Lancet Oncol. 2009;10(11):888–892.
7. Steyerberg EW. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating. 2nd ed. Springer; 2019.
8. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019;25(1):44–56.
缩略图提示(AI 图像生成)
照片写实图像:一位 70 多岁的老年人坐在明亮的咨询室里与肿瘤科医生交谈;平板电脑屏幕上显示着彩色的生存概率曲线和 SHAP 样条形图;背景中可以看到放射治疗面具和头颈部 CT 切片;平静、专业、包容的构图;高分辨率,自然光。



