PLCOm2012 风险分层选择优于 NELSON 标准用于德国肺癌检测：HANSE 队列研究结果

亮点

– 在 HANSE 前瞻性队列（n=5191）中，PLCOm2012（6 年风险 ≥1.58%）对肺癌检测的阳性预测值高于 NELSON 分类标准（2.59% vs 2.17%；p=0.0016）。

– 使用 PLCOm2012 检测出一例肺癌所需的筛查人数（38.6）低于 NELSON 标准（46.1），表明风险模型选择具有更高的效率。

– 研究的优势包括一个大型、前瞻性、真实世界的筛查队列和预定义的模型阈值；局限性包括种族多样性有限、随访间隔短以及结果集中在检测而非死亡率。

背景和临床背景

低剂量计算机断层扫描（LDCT）筛查在适当选择的高风险个体中可以降低肺癌死亡率，这一点已在国家肺癌筛查试验（NLST）和 NELSON 试验等里程碑式的研究中得到证实。试验和指南实施策略各不相同：一些使用基于年龄和累积吸烟暴露的简单分类资格规则，而另一些则提倡整合多个个体水平变量的风险预测模型来估计绝对肺癌风险。PLCOm2012 是评估最广泛的风险模型之一，被提议作为比分类方法更有效的筛选候选人的方式。

政策制定者和筛查项目规划者对从简单的分类规则（易于沟通和操作）转向基于风险模型的选择持谨慎态度，因为担心复杂性、公平性、模型在不同人群中的校准以及现实世界的效果。HANSE（德国）前瞻性队列研究直接比较了预定义的 PLCOm2012 阈值与分类 NELSON 标准，以解决这一实施问题。

研究设计和方法

HANSE 是一项在德国三大认证肺癌中心（Großhansdorf、Hannover 和 Lübeck）进行的正在进行的前瞻性队列研究。2021 年 7 月 23 日至 2022 年 8 月 19 日期间，研究人员招募了 5,191 名当前或既往吸烟者，年龄在 55 至 79 岁之间，符合 NELSON 分类风险标准或 PLCOm2012 6 年预测风险 ≥1.58%（阈值预先设定，以产生与 NELSON 标准相似的组大小）。

参与者接受了基线 LDCT 和 1 年随访 LDCT，所有下游诊断程序均按常规临床路径进行。预设的主要结局是在两次扫描之间的间隔期间，PLCOm2012 选择组与 NELSON 选择组之间检测到的肺癌的阳性预测值（PPV）的比较。此处报告的分析代表最终主要分析结果。

关键发现

在 5,191 名入组参与者中（女性 2,208 名 [43.5%]，男性 2,983 名 [57.5%]，5,076 名 [97.8%] 为欧洲白人），4,167 名符合 PLCOm2012 选择标准，3,916 名符合 NELSON 标准（部分参与者同时符合两项标准）。在中位间隔 1.05 年（IQR 0.95–1.08）和平均体积 CT 剂量指数 1.15 mGy（SD 0.15）的情况下，共检测到 111 例肺癌。

PLCOm2012 选择组的 PPV（即肺癌检出率）为 108/4,167（2.59%；95% CI 2.13–3.12），而 NELSON 选择组为 85/3,916（2.17%；95% CI 1.74–2.68）（p = 0.0016）。这转化为 PLCOm2012 检测一例肺癌所需筛查的人数较低：38.6（95% CI 32.1–46.9），而 NELSON 标准为 46.1（95% CI 37.3–57.5）。

简而言之，应用 PLCOm2012 阈值每筛查一人识别出更多癌症，相较于 NELSON 分类规则，在统计学上显著且临床上相关的效率有所提高。

解释和临床意义

HANSE 提供了前瞻性、真实世界证据，证明在德国筛查人群中，使用 PLCOm2012（6 年风险 ≥1.58%）的风险模型选择比 NELSON 分类标准更有效。较高的 PPV 和较低的 NNS 表明，基于风险的方法可以优先考虑绝对风险最高的个体进行筛查，从而可能提高检测率并减少每例检测到的病例所消耗的资源。

这些结果支持将经过验证的风险模型纳入程序性的 LDCT 筛查路径。实际益处可能包括每检测到一例癌症所需的扫描次数减少，以及潜在的减少后续诊断负担和低效筛查相关的成本。对于受制于容量或寻求最大化每项筛查资源效益的卫生系统，基于风险的选择似乎更具吸引力。

研究优势

– 前瞻性队列设计，预设主要终点和预定义的 PLCOm2012 阈值。

– 从认证的临床中心招募了大量样本，并在真实世界中应用筛查和诊断随访路径。

– 在同一入组人群中直接比较广泛使用的风险模型与分类试验衍生的选择规则。

局限性和考虑因素

– 非随机化设计用于分配选择策略：参与者符合一个或两个标准，未随机分配到单一选择方法。这限制了对下游结果（如死亡率）的因果推断。

– 报告的观察间隔较短（基线和首次年度扫描之间），重点关注检测指标而非长期结果（肺癌特异性或全因死亡率、过度诊断率或长期危害）。

– 种族多样性有限（97.8% 为欧洲白人），限制了对其他种族和民族群体的推广性，其中模型校准和性能可能有所不同。可能需要对更广泛的人群进行模型重新校准。

– 尽管 PLCOm2012 提高了效率，但 PPV 的绝对差异（0.42 个百分点）较小；项目影响将取决于目标人群的疾病患病率和操作成本。

– 实施障碍仍然存在：收集模型输入数据、电子健康记录集成、培训、法律和隐私问题，以及确保风险模型可能会使某些弱势群体降级的公平访问。

安全性和危害

HANSE 报告 LDCT 的平均体积 CT 剂量指数为 1.15 mGy，符合低剂量协议。该研究重点是检测性能，并未在此主要分析中报告死亡率或全面的危害指标（辐射累积暴露、假阳性、不必要的侵入性程序、心理影响或过度诊断）。任何转向基于风险的选择都应伴随在筛查项目中监测这些结果。

政策、实践和研究意义

HANSE 加强了采用经过验证的风险预测模型（如 PLCOm2012）作为有组织的肺癌筛查项目的资格标准的证据基础。政策制定者应权衡这种效率增益与实际实施和公平性问题。关键行动包括：

正式评估模型在校准不同人群中的表现，并在必要时进行重新校准。
进行比较成本效益分析，量化潜在的资源节约和人口层面的健康收益。
开展操作研究，将风险计算器整合到初级保健工作流程和筛查邀请中，包括数字工具和数据隐私保护措施。
进行前瞻性随机或基于人群的实施试验，随访时间更长，以评估死亡率获益、危害（过度诊断、假阳性）和公平性结果。

专家评论

HANSE 的发现与越来越多的证据一致，表明基于风险的选择可以提高 LDCT 筛查相对于简单分类规则的检测率。然而，将检测效率转化为降低死亡率和净人口受益需要更长期的数据和周到的项目设计。指南小组（例如 USPSTF、欧洲机构）在更新建议时可能会考虑这些数据以及成本效益和健康公平性分析。

结论

在 HANSE 前瞻性队列中，PLCOm2012 6 年风险阈值 ≥1.58% 选择的筛查人群具有更高的肺癌检出率和更低的筛查所需人数，优于 NELSON 分类标准。这些发现支持实施经过验证的风险预测模型以提高筛查效率，同时强调需要关注校准、公平性、操作可行性以及包括死亡率和危害在内的长期结果。

资金来源和试验注册

资金来源：联邦教育和研究部（德国肺病研究中心）和阿斯利康。

ClinicalTrials.gov 注册号：NCT04913155。

精选参考文献

1. Vogel-Claussen J, Bollmann BA, May K, et al.; HANSE 研究人员. 德国 NELSON 与 PLCOm2012 肺癌筛查资格标准的有效性比较（HANSE）：一项前瞻性队列研究。Lancet Oncol. 2025 年 11 月 10 日：S1470-2045(25)00490-5。doi:10.1016/S1470-2045(25)00490-5。

2. 国家肺癌筛查试验研究团队. 低剂量计算机断层扫描筛查降低肺癌死亡率。N Engl J Med. 2011;365:395–409。

3. de Koning HJ, van der Aalst CM, de Jong PA, et al. 一项随机试验中，低剂量 CT 筛查降低肺癌死亡率。N Engl J Med. 2020;382:503–513。

4. 美国预防服务工作组. 肺癌筛查：美国预防服务工作组推荐声明。JAMA. 2021;325(10):962–970。

作者注

本文总结并批判性地评价了 HANSE 前瞻性队列比较 PLCOm2012 和 NELSON 选择方法用于 LDCT 筛查的主要分析结果。旨在为参与肺癌筛查实施和指南开发的临床医生、项目规划者和政策制定者提供参考。