亮点
– AI-RAPNO 描述了针对儿科特定的肿瘤分割、反应量化和预后评估的人工智能进展,同时强调了小数据集和异质成像协议等独特的儿科挑战。
– 该倡议建议标准化成像协议、强大的外部验证、模型可解释性和基础设施(数据管理、联邦学习),以实现 RAPNO 反应框架内的可信临床转化。
– 优先应用包括与 RAPNO 指标对齐的自动体积分割、多模态整合(成像、分子、临床)以及使用合成对照以支持试验效率,但监管、伦理和操作障碍仍然存在。
背景和疾病负担
儿童脑肿瘤是高收入国家儿童癌症相关死亡的主要原因,代表了一组具有多样化组织病理学、分子亚型和临床行为的肿瘤。基于成像的准确和可重复的反应评估对于临床管理、风险适应治疗和试验终点至关重要。儿科神经肿瘤学反应评估标准 (RAPNO) 的制定旨在为儿科人群提供标准化的反应和进展定义,力求在试验中统一终点报告。
人工智能 (AI),尤其是深度学习,可以显著减少手动工作量,增加定量成像生物标志物(例如,肿瘤体积和对比增强)的可重复性,并整合复杂的多模态数据。然而,儿科神经肿瘤学具有直接采用成人衍生 AI 系统的复杂特征:发病率较低导致数据集较小、大脑形态的发育变化、具有不同成像表型的更广泛的肿瘤类型以及中心间和时间上的成像协议差异。
AI-RAPNO 的研究设计和范围
AI-RAPNO 计划(详细见发表在《柳叶刀肿瘤学》上的两篇配套论文)是一项政策导向的多学科倡议,批判性地回顾了儿科神经肿瘤学当前的人工智能方法(第 1 部分),并提出了临床转化的挑战、机遇和实施建议(第 2 部分)。这项工作综合了已发表的文献、分割和预后建模的技术进步以及 RAPNO 社区的专家共识,为研究人员、试验者、监管机构和临床团队生成可操作的指导。
由于 AI-RAPNO 是一项共识和政策审查,而不是主要的临床试验,其“终点”是实际的:确定高优先级用例、定义验证期望,并提出允许 AI 工具安全集成到 RAPNO 框架和临床试验中的基础设施和监管路径。
关键发现和技术进步
1. 儿科成像的特定任务 AI 工具
最近的技术研究表明,当在适当策划的儿科数据集上训练时,深度学习模型可以实现高精度的肿瘤分割和体积量化。进展包括 3D 卷积神经网络 (CNN) 和专为多模态 MR 序列(T1、增强后 T1、T2、FLAIR)定制的注意力架构。儿科专用模型在许多儿科肿瘤类型中优于成人训练模型,因为它们学习了年龄和肿瘤特异性形态模式。
2. 与 RAPNO 指标的对齐
AI 可以自动生成 RAPNO 中心指标,包括二维测量、体积肿瘤负荷和增强部分。自动体积测量可以减少读者间的变异性和每项研究的时间。将 AI 衍生指标整合到 RAPNO 报告模板中将有助于跨试验和纵向临床护理的标准化终点捕获。
3. 多模态整合和预后评估
除了分割外,结合成像、基因组学、临床状态(年龄、症状)和治疗暴露的多模态 AI 模型可以改善无进展生存期、治疗反应和晚期效应的预测。这些整合模型有潜力用于个体化风险分层,以及丰富或分层临床试验队列。
4. 合成对照和试验效率
AI 可以支持使用注释良好的注册表和协调的成像衍生终点创建高质量的历史或合成对照臂。当经过仔细验证时,这些方法可以减少罕见儿科肿瘤随机试验所需的患者数量,加快新型药物的评估,并最大限度地减少无效疗法的暴露。
5. 技术和验证差距
重要限制仍然存在:小而分散的数据集、MRI 采集的异质性(场强、序列参数)、有限的外部验证以及倾向于报告乐观的内部性能而不报告校准或决策影响研究。模型可解释性通常不足以获得临床接受,而且很少有前瞻性研究证明在使用 AI 指导护理时的临床效用或改善结果。
临床实施的挑战
数据异质性和稀缺性
儿科神经肿瘤学研究通常规模较小且分布在多个机构。MRI 协议、对比剂剂量和时间以及机构特定的后处理的差异挑战了模型的泛化能力。集中数据共享受到隐私法律和变量同意的限制,特别是对于较老的队列。
模型泛化和稳健性
在一个中心训练的模型在应用于外部数据时往往表现不佳。在扫描仪、供应商和采集协议之间进行鲁棒性测试是必不可少的;这包括对与年龄相关的解剖变异和术后成像(瘢痕、血液制品或硬件可能混淆分割)的压力测试。
监管和伦理考虑
用于试验或临床决策中的反应评估的 AI 工具很可能符合医疗设备的定义,必须满足监管途径(例如,FDA 软件作为医疗设备)。要求包括关于训练数据的透明度、子群体的性能以及上市后的监控。伦理问题包括数据主权、二次数据使用的知情同意以及可能影响代表性不足的肿瘤亚群的偏见。
整合到临床工作流程中
除了算法性能之外,部署还需要与 PACS、放射学报告系统和试验病例报告表的整合。放射科医生的接受取决于清晰、可解释的输出以及 AI 减少工作量或提高诊断准确性而不引入新风险的证据。
来自 AI-RAPNO 的建议
1. 标准化和协调成像采集
开发和推广针对常见肿瘤类型和时间点(诊断、早期反应、监测)优化的儿科 MRI 协议,以减少采集变异性。当协调不可行时,记录采集元数据并应用事后协调方法。
2. 创建高质量注释数据集
建立多机构注册表,注释与 RAPNO 终点映射的标准。使用共同的注释协议、多读取者共识和版本化的数据集,以支持基准测试和可重复的模型开发。
3. 强调外部验证和校准
要求在模型报告中进行多机构、多供应商的外部验证。呈现校准指标和子群体分析(如年龄分层、肿瘤亚型)。应优先考虑可行的前瞻性临床验证和随机实施试验。
4. 支持联邦和隐私保护学习
为克服数据共享约束,投资联邦学习和其他隐私保护方法,允许跨机构进行模型训练而不集中原始数据。建立与儿科研究伦理一致的数据治理框架和同意模板。
5. 定义监管和报告标准
尽早与监管机构接触,明确用于反应评估的 AI 工具的期望。鼓励采用 TRIPOD-AI 和 CLAIM 等报告标准,并在伦理和法律允许的情况下要求公开发布模型权重和代码,以支持独立评估。
专家评论和注意事项
AI-RAPNO 代表了一条连接技术创新和临床需求的实际路线图。对自动化体积测量和多模态预后评估的热情必须通过严格的评估来缓和:模型应证明它们以使患者受益、提高试验效率或产生更可靠终点的方式改变临床医生的行为。采用将取决于对安全性、各亚组公平性和成本效益的明确证明,以及在现实世界工作流程中的效果。
综述的局限性包括领域快速演变——新的架构和联邦倡议不断涌现——以及不同用例的证据成熟度不一。利益相关者应将建议视为最佳实践而非僵硬的命令。
结论和未来方向
AI 有潜力通过提供与 RAPNO 标准对齐的可重复、定量和多模态生物标志物来改变儿科神经肿瘤学的反应评估。实现这一潜力需要在标准化成像、策划数据集、外部验证、监管参与和临床实施研究方面进行协调投资。有了这些要素,AI 驱动的工具可以改进试验设计,实现个性化护理,最终改善脑肿瘤儿童的预后。
资金和 clinicaltrials.gov
AI-RAPNO 的成果是儿科神经肿瘤学反应评估 (RAPNO) 社区的产物,并在两篇配套的《柳叶刀肿瘤学》政策论文中报告。读者应查阅原始出版物以获取详细的资助披露和作者声明。AI-RAPNO 政策审查本身没有特定的 clinicaltrials.gov 注册;推荐的前瞻性验证研究应在标准试验注册处注册。
参考文献
1. Kann BH, Vossough A, Brüningk SC, Familiar AM, Aboian M, Linguraru MG, Yeom KW, Chang SM, Hargrave D, Mirsky D, Storm PB, Huang RY, Resnick AC, Weller M, Mueller S, Prados M, Peet AC, Villanueva-Meyer JE, Bakas S, Fangusaro J, Nabavizadeh A; Response Assessment in Pediatric Neuro-Oncology (RAPNO) group. Artificial Intelligence for Response Assessment in Pediatric Neuro-Oncology (AI-RAPNO), part 1: review of the current state of the art. Lancet Oncol. 2025 Nov;26(11):e597-e606. doi: 10.1016/S1470-2045(25)00484-X. PMID: 41167227.
2. Kazerooni AF, Familiar AM, Aboian M, Brüningk SC, Vossough A, Linguraru MG, Huang RY, Hargrave D, Peet AC, Resnick AC, Storm PB, Mirsky D, Yeom KW, Weller M, Prados M, Chang SM, Mueller S, Villanueva-Meyer JE, Bakas S, Fangusaro J, Kann BH, Nabavizadeh A; Response Assessment in Pediatric Neuro-Oncology (RAPNO) group. Artificial Intelligence for Response Assessment in Pediatric Neuro-Oncology (AI-RAPNO), part 2: challenges, opportunities, and recommendations for clinical translation. Lancet Oncol. 2025 Nov;26(11):e607-e618. doi: 10.1016/S1470-2045(25)00489-9. PMID: 41167228.
3. Menze BH, Jakab A, Bauer S, et al. The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS). IEEE Trans Med Imaging. 2015;34(10):1993-2024. doi:10.1109/TMI.2014.2377694.
4. Ostrom QT, Gittleman H, Fulop J, et al. CBTRUS Statistical Report: Primary brain and other central nervous system tumors diagnosed in the United States, 2013-2017. Neuro Oncol. 2020;22(Suppl 2):iv1–iv96. doi:10.1093/neuonc/noaa200.
5. U.S. Food & Drug Administration. Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device Action Plan. FDA; 2021. Available at: https://www.fda.gov/medical-devices/software-medical-device-samd/artificial-intelligencemachine-learning-ai-ml-based-software-medical-device (accessed 2025).

