神经网络预测老年头颈部癌症患者的生存率 —— 有用,但尚未改变实践

神经网络预测老年头颈部癌症患者的生存率 —— 有用,但尚未改变实践

亮点

– 国际回顾性队列研究(SENIOR 注册表)使用人工神经网络(ANNs)预测接受根治性放化疗的≥65岁局部晚期 HNSCC 患者的总生存期(OS)和无进展生存期(PFS)。

– 模型实现了中等的区分能力(OS ROC-AUC 0.68,PFS ROC-AUC 0.64),并确定人乳头瘤病毒(HPV)状态、估算的肾小球滤过率(eGFR)、东部肿瘤协作组(ECOG)表现状态和淋巴结分类为主要影响特征。

背景

头颈部鳞状细胞癌(HNSCC)是一种主要影响老年人的疾病。这一人群在合并症、功能储备和治疗耐受性方面具有异质性,但在随机试验中老年患者代表性不足。因此,临床医生经常需要在没有强有力的年龄特异性证据的情况下个体化根治性放化疗决策。

整合常规可用临床变量的预测模型可以协助共同决策、调整强度和分配支持资源。机器学习(ML),包括人工神经网络(ANNs),有望检测传统回归可能遗漏的非线性关系和交互作用。然而,在实际应用之前,模型性能、可解释性、外部验证和临床效用仍然是关键障碍。

研究设计

Marschner 等人报告了一项国际回顾性队列研究(SENIOR 注册表),该研究开发并外部验证了两个 ANN 模型,以预测接受根治性放疗和同期系统治疗的≥65岁局部晚期 HNSCC 老年患者的 OS 和 PFS(2005-2019 年间)。关键纳入标准包括:年龄≥65岁、局部晚期 HNSCC、根治性放化疗。排除标准包括诱导或辅助化疗、既往头颈部癌症或治疗开始时的转移性疾病。数据来自德国、瑞士、捷克共和国、塞浦路斯和美国的 19 个学术中心。病例收集时间为 2005-2019 年;数据整理时间为 2021-2023 年。分析时间为 2023 年 12 月至 2025 年 4 月。

训练和测试集划分:对于 OS,训练集 738 例,测试集 160 例(总计 n=898)。对于 PFS,训练集 770 例,测试集 175 例(总计 n=945)。模型通过 ROC 曲线下面积(AUC)和精确率-召回率 AUC 进行评估;特征重要性和可解释性通过 Shapley 加性解释(SHAP)值进行评估。患者根据模型输出的中位数阈值被分为高风险和低风险组。

主要发现

人群特征:中位年龄 71 岁(四分位距 68-76);约三分之二为男性(74%)。队列包括接受根治性放疗加同期系统治疗的患者;HPV 状态在可用时被纳入。

模型性能

– 总生存期 ANN:外部测试队列中的 ROC-AUC 为 0.68(95% CI,0.60-0.76)。该模型将患者分为高风险和低风险组,生存差异具有统计学意义。

– 无进展生存期 ANN:测试集中的 ROC-AUC 为 0.64(95% CI,0.56-0.72)。

– 报告了精确率-召回率 AUC 以解决类别不平衡问题;数值未在摘要中突出显示,但用于补充区分指标。

最重要的预测特征

SHAP 分析确定了模型中最主要的预测因子:人乳头瘤病毒(HPV)状态(在口咽癌中具有强烈的预后意义)、由 eGFR 测量的肾功能、ECOG 表现状态和淋巴结分类(N 期)。这些特征与临床知识一致:HPV 阳性的口咽癌预后较好,基线功能状态和器官功能影响治疗耐受性和竞争性死亡率,淋巴结负担与复发风险相关。

风险分层和潜在临床用途

使用模型输出的中位数作为二元截止点,ANN 将患者分为具有不同生存轨迹的组。作者建议这些模型可以支持治疗个性化——例如,识别高竞争性死亡风险的患者,这些患者可能适合治疗降级或增强的支持护理,或识别低风险的老年患者,他们可以合理地耐受标准的根治性放化疗。

专家评论:解读、优势和局限性

该研究通过关注老年 HNSCC 患者并使用多中心数据进行开发和外部测试,解决了临床上有意义的空白。几个方面增强了其贡献:

  • 国际多中心数据增加了异质性,相比单中心模型提高了潜在的通用性。
  • 使用外部测试集而非仅内部交叉验证,是朝着无偏性能评估迈出的关键一步。
  • 通过 SHAP 提供的模型可解释性提供了可解释的特征贡献,便于临床医生评估模型行为。

然而,关键的局限性限制了立即临床应用的热情:

  • 中等区分能力:OS 的 ROC-AUC 为 0.68,PFS 的 ROC-AUC 为 0.64,表明在个体水平上分离结果的能力仅属中等。对于临床决策,特别是当决策涉及重大病态时,通常需要更高的区分能力和证明的净益处。
  • 校准和临床效用:摘要报告了区分指标,但未提供校准图或决策曲线分析。具有可接受区分能力的模型仍可能错误估计绝对风险,导致次优的临床建议。
  • 回顾性设计和潜在的信息偏差:2005-2019 年的数据包括分期、HPV 检测实践、放疗技术(IMRT 采用)和系统治疗(如西妥昔单抗与铂类药物,免疫治疗的发展)的时间变化。治疗方案的异质性和细微变量(剂量强度、中断、社会决定因素)的不完全捕捉可能会影响模型性能和可移植性。
  • 缺乏老年特异性测量:老年患者结局的关键决定因素——全面老年评估领域(如认知、行动能力、营养、社会支持和多重用药)——未被强调。现有的老年肿瘤学工具(CARG 毒性评分、老年评估)提供的信息超出了表现状态和实验室值,并可能改善个体化预测(Hurria 等,2011;Mohile 等,2018)。
  • 竞争风险和特定原因结局:老年人因非癌症原因有显著的竞争性死亡率。预测 OS 的模型可能需要使用竞争风险方法来区分癌症相关死亡和其他原因的死亡,这对专注于疾病控制与寿命的治疗决策有直接影响。
  • 对决策和结局的影响未知:核心问题是 ANN 支持的决策是否能改变管理并改善以患者为中心的结局(生存、生活质量、治疗毒性)。需要前瞻性影响研究或随机对照试验来证明临床益处并检测意外伤害。

这些模型如何融入当前实践

针对老年人的预测工具应补充而不是替代全面的临床评估。当前的老年肿瘤学指南建议结合老年评估来识别脆弱性并指导管理(例如,ASCO 指南)。基于常规临床变量训练的 ANN 可以作为一个易于访问的初步筛查工具,标记出需要进行全面老年评估、试验入组或早期姑息治疗转诊的患者。

考虑整合这些模型的临床医生和机构应要求透明的模型输入、预处理、缺失数据处理、本地人群校准以及解释不确定性的用户友好界面。工作流程整合还必须尊重患者价值观并确保共同决策,尤其是在模型建议降级治疗时。

下一步和研究重点

为了将这些 ANN 转化为实践,建议采取以下步骤:

  • 在多样化的临床环境中进行前瞻性验证,使用最新的治疗方案和完整的老年变量。
  • 进行校准评估,如有必要,进行本地重新校准以保持准确的绝对风险估计。
  • 进行决策曲线分析和临床影响研究,以评估净益处和以患者为中心的结局。
  • 与老年评估工具和生物标志物(如炎症标志物、虚弱指数)集成,以提高区分能力和临床相关性。
  • 进行伦理和实施研究,解决透明度、临床医生接受度和避免算法偏差(例如,跨人口群体的性能差异)。

结论

Marschner 及其同事开发并外部测试了 ANN,这些模型在老年局部晚期 HNSCC 接受根治性放化疗的患者中中等地区分了 OS 和 PFS。重要的预测因子(HPV、eGFR、ECOG、淋巴结分期)证实了临床直觉并支持模型的表面效度。然而,中等的 AUC 值、未报告的校准和决策曲线指标、回顾性设计和有限的老年特异性细节意味着这些模型是假设生成的,而不是准备好常规临床部署的。

在将这些 ANN 推荐为这一易感人群的决策支持工具之前,需要进行良好的前瞻性验证、与老年评估的整合和影响评估。在此期间,这些模型提供了一个有前景的框架,可以更精确地进行风险分层,并优先对患者进行全面老年评估和个性化治疗计划。

资金和临床试验注册

资金:未在提供的摘要中报告。请参阅原始的 JAMA Otolaryngology—Head & Neck Surgery 文章以获取完整的资金披露。

ClinicalTrials.gov:不适用;回顾性注册研究。

参考文献

1. Marschner SN, Lombardo E, Haehl E, et al. Outcome Prediction in Older Adults With Head and Neck Cancer Undergoing Chemoradiation. JAMA Otolaryngol Head Neck Surg. 2025 Nov 6:e253840. doi:10.1001/jamaoto.2025.3840.

2. Hurria A, Togawa K, Mohile SG, et al. Predicting Chemotherapy Toxicity in Older Adults With Cancer: A Prospective Multicenter Study. J Clin Oncol. 2011;29(25):3457–3465.

3. Mohile SG, Cesari M, Hurria A, et al. Practical Assessment and Management of Vulnerabilities in Older Patients Receiving Chemotherapy: ASCO Guideline. J Clin Oncol. 2018;36(22):2326–2347.

4. Collins GS, Reitsma JB, Altman DG, Moons KG. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): The TRIPOD Statement. Ann Intern Med. 2015;162(1):55–63.

5. Lundberg SM, Lee SI. A unified approach to interpreting model predictions. arXiv:1705.07874. 2017.

6. Pignon JP, le Maître A, Maillard E, Bourhis J; MACH-NC Collaborative Group. Meta-analysis of chemotherapy in head and neck cancer (MACH-NC): an update on 93 randomized trials and 17,346 patients. Lancet Oncol. 2009;10(11):888–892.

7. Steyerberg EW. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating. 2nd ed. Springer; 2019.

8. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019;25(1):44–56.

缩略图提示(AI 图像生成)

照片写实图像:一位 70 多岁的老年人坐在明亮的咨询室里与肿瘤科医生交谈;平板电脑屏幕上显示着彩色的生存概率曲线和 SHAP 样条形图;背景中可以看到放射治疗面具和头颈部 CT 切片;平静、专业、包容的构图;高分辨率,自然光。

神経망が頭頸部がんの高齢者の生存を予測 — 有用だが、まだ診療の変革には至らない

神経망が頭頸部がんの高齢者の生存を予測 — 有用だが、まだ診療の変革には至らない

ハイライト

– 国際後方視コホート(SENIORレジストリ)では、人工ニューラルネットワーク(ANN)を使用して、確定化学放射線治療を受けた65歳以上の局所進行HNSCC患者の全生存期間(OS)と無増悪生存期間(PFS)を予測した。

– モデルは中程度の識別力(OS ROC-AUC 0.68、PFS ROC-AUC 0.64)を達成し、ヒトパピローマウイルス(HPV)ステータス、推定糸球体濾過率(eGFR)、東京協同病院がん治療評価基準(ECOG)パフォーマンスステータス、およびリンパ節分類が最も影響力のある特徴であることが確認された。

背景

頭頸部扁平上皮癌(HNSCC)は主に高齢者に影響を与える疾患である。この集団は、合併症、機能的予備力、治療耐性の面で異質であり、しかし高齢患者は無作為化試験で低く評価されている。その結果、医師は堅牢で年齢別の証拠がない状況で確定化学放射線治療の決定を個別化する必要があることが多い。

一般的な臨床変数を統合する予測モデルは、共同意思決定、強度の調整、および支援リソースの配分を助けることができる。機械学習(ML)、特に人工ニューラルネットワーク(ANN)は、従来の回帰分析では見落とされる非線形関係や相互作用を検出することを約束している。ただし、モデルの性能、解釈可能性、外部検証、および臨床有用性は、実装前の重要な障壁である。

研究デザイン

Marschnerらは、2005年から2019年の間に確定放射線治療と並行全身療法を受けた65歳以上の局所進行HNSCC患者を対象とした国際後方視コホート研究(SENIORレジストリ)を報告した。この研究では、全生存期間(OS)と無増悪生存期間(PFS)を予測する2つのANNモデルを開発し、外部検証を行った。

主要な包含基準:65歳以上、局所進行HNSCC、確定化学放射線治療。除外基準には、誘導または補助化学療法、既往の頭頸部がん、治療開始時の転移性疾患が含まれる。データは、ドイツ、スイス、チェコ共和国、キプロス、米国の19の学術センターからプールされた。症例収集の時間枠は2005年〜2019年、データキュレーションは2021年〜2023年、解析は2023年12月〜2025年4月に行われた。

訓練とテストの分割:OSの場合、訓練用に738人、テスト用に160人(合計n=898)。PFSの場合、訓練用に770人、テスト用に175人(合計n=945)。モデルはROC曲線下面積(AUC)と精度-再現率AUCで評価され、特徴重要度と解釈可能性はShapley加法的説明(SHAP)値で評価された。患者は、モデル出力の中央値閾値を使用して高リスク群と低リスク群に分類された。

主要な知見

人口特性:中央年齢71歳(四分位範囲68-76)、約3分の4が男性(74%)。このコホートは、確定放射線治療と並行全身療法を受けた患者で構成されており、利用可能な場合はHPVステータスが含まれている。

モデル性能

– 全生存期間ANN:外部テストコホートでのROC-AUC 0.68(95%信頼区間、0.60-0.76)。このモデルは、生存率に統計的に有意な差がある高リスク群と低リスク群に患者を層別化した。

– 無増悪生存期間ANN:テストでのROC-AUC 0.64(95%信頼区間、0.56-0.72)。

– 精度-再現率AUCはクラス不均衡に対処するために報告されたが、数値は要約には強調表示されず、識別指標を補完するために使用された。

主要な予測特徴

SHAP分析により、最も影響力のある予測因子が特定された:ヒトパピローマウイルス(HPV)ステータス(咽頭癌では強力な予後因子)、腎機能(eGFRで測定)、ECOGパフォーマンスステータス、およびリンパ節分類(Nステージ)。これらの特徴は臨床的な知識と一致している:HPV陽性の咽頭癌は予後が良い、基本的な機能状態と臓器機能は治療耐性と競合死亡率に影響を与え、リンパ節負荷は再発リスクと相関している。

リスク層別化と潜在的な臨床用途

モデル出力の中央値を使用して二進分類すると、ANNは異なる生存軌道を持つグループに患者を分類した。著者は、これらのモデルが治療の個別化をサポートできると提案している。例えば、競合死亡リスクが高い患者を特定し、治療の強度低下や強化された支援ケアが適切であるか、または標準的な化学放射線治療を耐えられる可能性のある低リスクの高齢者を特定することができる。

専門家のコメント:解釈、強み、限界

この研究は、HNSCCの高齢者に焦点を当て、複数施設のデータを使用して開発と外部検証を行うという、臨床的に意味のあるギャップに取り組んでいる。いくつかの側面がその貢献を強化している:

  • 国際的、多施設のデータは、単一施設のモデルと比較して異質性を増やし、潜在的な一般化可能性を高める。
  • 外部検証セットが使用され、内部交差検証のみが使用されるのではなく、これはバイアスのない性能評価への重要な一歩である。
  • SHAPによるモデルの解釈可能性は、医師がモデルの動作を評価する際の特徴寄与の解釈可能性を提供する。

ただし、即時臨床展開への熱意を抑える重要な制限がある:

  • 中程度の識別力:OSのROC-AUC 0.68、PFSの0.64は、個人レベルでのアウトカムの分離能力が中程度であることを示す。臨床的決定において、特に重大な合併症を伴う決定の場合、より高い識別力と証明された純利益が必要とされることが多い。
  • 適合度と臨床有用性:要約では識別指標が報告されているが、適合度プロットや決定曲線分析は提示されていない。識別力のあるモデルでも、絶対リスクを誤って推定し、劣った臨床的推奨を生む可能性がある。
  • 後方視設計と情報バイアスの可能性:2005年〜2019年のデータには、ステージング、HPV検査の実践、放射線治療技術(IMRTの採用)、全身療法(セツキシマブ対プラチナ、進化する免疫療法)の時間的な変化が含まれている。治療レジメンの異質性と微細な変数(投与量強度、中断、社会的決定要因)の不完全な捕捉は、モデルの性能と移植可能性に影響を与える可能性がある。
  • 高齢者特有の測定項目の欠如:高齢者のアウトカムを決定する主要な要素——包括的高齢者評価の領域(認知、移動、栄養、社会的支援、多剤服用)——が強調されていない。既存の高齢者腫瘍学ツール(CARG毒性スコア、高齢者評価)は、パフォーマンスステータスと検査値を超えて情報を追加し、個別化予測を改善する可能性がある(Hurriaら、2011年;Mohileら、2018年)。
  • 競合リスクと原因別のアウトカム:高齢者には非がん性原因による競合死亡率が大幅にある。OSを予測するモデルは、がん関連死亡と他の原因との区別のために競合リスクの方法が必要であり、これは病気制御と寿命に焦点を当てた治療決定に直接影響を与える。
  • 決定とアウトカムへの影響が不明:中心的な問いは、ANNに基づく決定が管理を変更し、患者中心のアウトカム(生存、生活の質、治療毒性)を改善するかどうかである。前向き影響研究や無作為化比較試験が必要である。

これらのモデルが現在の診療にどのように組み込まれるか

高齢者向けの予測ツールは、包括的な臨床評価を補完するものであり、置き換えるものではない。現在の高齢者腫瘍学ガイドラインでは、高齢者評価を組み込むことが推奨されている(ASCOガイドライン)。日常の臨床変数に基づいて訓練されたANNは、患者を全面的な高齢者評価、試験登録、早期緩和ケア紹介のためのフラグを立てるアクセス可能な一次トリアージツールとなる可能性がある。

モデルの統合を検討している医師や機関は、モデル入力、前処理、欠損データの処理、地元人口の適合度、および不確実性を説明するユーザーセンタードインターフェースに関する透明性を要求するべきである。ワークフローの統合は、患者の価値観を尊重し、共有意思決定を確保する必要があり、特にモデルが強度低下を提案する場合も同様である。

次なるステップと研究の優先事項

これらのANNを診療に翻訳するためには、以下のステップが推奨される:

  • 最新の治療プロトコルと完全な高齢者変数を含む多様な臨床設定での前向き検証。
  • 適合度評価と、必要に応じて地元での再適合度を維持するためのローカル再適合。
  • 決定曲線分析と臨床影響研究を行い、純利益と患者中心のアウトカムを評価する。
  • 高齢者評価ツールやバイオマーカー(炎症マーカー、虚弱指数など)との統合を行い、識別力と臨床的関連性を向上させる。
  • 透明性、医師の受け入れ、アルゴリズムバイアス(人口統計グループ間の差別的性能など)の回避に関する倫理的および実装研究。

結論

Marschnerらは、確定化学放射線治療を受けた局所進行HNSCCの高齢者におけるOSとPFSを中程度に識別するANNを開発し、外部検証した。重要な予測因子(HPV、eGFR、ECOG、リンパ節ステージ)は臨床的な直感を裏付け、モデルの顔面妥当性を支持している。しかし、中程度のAUC、報告されていない適合度と決定曲線指標、後方視設計、高齢者特有の詳細の不足により、これらのモデルは仮説生成段階であり、常規の臨床展開には至っていない。

前向き検証、高齢者評価との統合、影響評価が行われるまでは、これらのモデルは脆弱な集団における意思決定支援ツールとして推奨することはできない。一方、これらのモデルは、リスク層別化を鋭化し、包括的な高齢者評価と個別化治療計画の優先順位を決めるための有望なフレームワークを提供している。

資金源とClinicalTrials.gov

資金源:提供された要約には報告されていない。完全な資金源開示については、元のJAMA Otolaryngology—Head & Neck Surgery記事を参照のこと。

ClinicalTrials.gov:該当なし;後方視レジストリ研究。

参考文献

1. Marschner SN, Lombardo E, Haehl E, et al. Outcome Prediction in Older Adults With Head and Neck Cancer Undergoing Chemoradiation. JAMA Otolaryngol Head Neck Surg. 2025 Nov 6:e253840. doi:10.1001/jamaoto.2025.3840.

2. Hurria A, Togawa K, Mohile SG, et al. Predicting Chemotherapy Toxicity in Older Adults With Cancer: A Prospective Multicenter Study. J Clin Oncol. 2011;29(25):3457–3465.

3. Mohile SG, Cesari M, Hurria A, et al. Practical Assessment and Management of Vulnerabilities in Older Patients Receiving Chemotherapy: ASCO Guideline. J Clin Oncol. 2018;36(22):2326–2347.

4. Collins GS, Reitsma JB, Altman DG, Moons KG. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): The TRIPOD Statement. Ann Intern Med. 2015;162(1):55–63.

5. Lundberg SM, Lee SI. A unified approach to interpreting model predictions. arXiv:1705.07874. 2017.

6. Pignon JP, le Maître A, Maillard E, Bourhis J; MACH-NC Collaborative Group. Meta-analysis of chemotherapy in head and neck cancer (MACH-NC): an update on 93 randomized trials and 17,346 patients. Lancet Oncol. 2009;10(11):888–892.

7. Steyerberg EW. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating. 2nd ed. Springer; 2019.

8. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019;25(1):44–56.

サムネイルプロンプト(AI画像生成)

写実的な画像:70歳前後の高齢者が明るい診察室で腫瘍科医と座っている様子。タブレット画面には色付きの生存確率曲線とSHAPスタイルの棒グラフが表示され、放射線治療マスクと頭頸部CT断面像が背景に見える。落ち着いた、プロフェッショナルで包摂的な構成。高解像度、自然光。

Comments

No comments yet. Why don’t you start the discussion?

发表回复