亮点
- 人工智能有潜力革新临床试验的每一个阶段,但其影响的定量证据仍然有限。
- 迫切需要以价值为基础的框架来指导临床试验中人工智能的有效采纳和效益测量。
- 利益相关者的参与——包括患者——对于确保有意义地整合人工智能工具至关重要,避免低效、零散的部署。
- 持续的证据综合和监测对于及时、合乎伦理地采纳试验设计和实施中的人工智能创新至关重要。
研究背景与疾病负担
临床试验是循证医学的基石,为监管决策、临床指南和患者护理提供依据。然而,现实是许多试验耗时长、成本高,且往往无法提供可操作的结果——有时被描述为“无信息”。这种低效率不仅延迟了新疗法的可用性,还使参与者面临不必要的风险,并在研究生态系统中造成资源浪费。人工智能(AI)的兴起提供了诱人的前景,通过自动化劳动密集型任务、优化决策和提高试验的稳健性来改变临床试验的设计、实施和分析。然而,将这一承诺转化为有意义、可衡量的结果仍然不一致,如何最佳评估和评价人工智能在这一领域的贡献也缺乏共识。
研究设计
Mateen等人(《柳叶刀数字健康》,2025年)提供的是一种概念分析,而不是主要的临床研究。他们的工作综合了当前文献和实践经验,批判性地考察了人工智能在临床试验生命周期中可以发挥哪些作用以及如何发挥作用。作者强调了缺乏高质量的定量研究来评估人工智能的影响,并倡导采用结构化、以价值为导向的框架——类似于卫生经济学中的质量调整生命年(QALYs)——来指导临床研究中的人工智能采纳。他们讨论了潜在的指标、方法(如离散选择实验)以及广泛的利益相关者参与的重要性。
关键发现
1. 人工智能应用贯穿整个临床试验生命周期
从方案开发(例如,AI赋能的设计工具如Protocol AI)到患者招募(例如,大型语言模型筛选电子健康记录)、数据监测和结果报告,人工智能技术可以提高效率并可能改善试验的信息量。然而,人工智能具备执行这些功能的能力并不保证价值——必须进行情境和结果特定的评估。
2. 现有证据稀缺且分散
尽管普遍热情高涨,但关于人工智能在临床试验中的实际影响的稳健、定量研究仍然很少。大多数证据是轶事或基于早期采用者的经验。例如,虽然AI节省的一小时患者筛查时间是可以衡量的,但其相对于节省的一小时方案开发时间的价值并没有标准化,并且根据试验背景、疾病领域和紧迫性(如疫情应对与慢性病试验)可能会有很大差异。
3. 需要以价值为基础的评估框架
作者借鉴了卫生技术评估中的QALYs和DALYs,呼吁紧急开发标准化的临床试验中人工智能的价值框架。这将使不同的人工智能工具和应用能够进行有意义的比较。离散选择实验——用于量化利益相关者的偏好——被提议为一种方法,以捕捉对不同改进(如效率、稳健性和可重复性)分配的异质性价值。
4. 利益相关者的参与至关重要
有效的价值框架必须纳入试验者、资助者、患者和社区的观点,符合最近参与式研究和监管指导的趋势。如果不这样做,可能会导致盲目、低效甚至有害地采纳不符合患者利益或社会需求的人工智能工具。
5. 三个关键指标:信息量、成本效益、可重复性
许多人工智能解决方案专注于单一价值维度(如成本最小化或招募速度),但更广泛的生态系统效益(如解决可重复性危机)往往被忽视。过度依赖简单、有形的好处(如成本节约)可能会无意中边缘化那些改善研究完整性的创新或提高组合级试验成功率的可能性。
6. 组合优化和预测性人工智能
最近的发展表明,人工智能可以预测试验成功的可能性(即提供明确的结果),从而有可能优化整个试验组合的效率和信息量,而不仅仅是关注单个研究。
7. 持续的证据综合和机构监测
作者提倡建立专门的观测站或监测机构,以维护临床试验中人工智能应用的动态系统综述,确保及时综合证据并在特定人工智能工具的采纳变得合乎伦理和科学必要时发出信号。
8. 对监管事务和生态系统流程的影响
除了试验实施之外,人工智能还可以增强相关的流程,如监管情报、多司法管辖区方案设计和加速监管审查。未来的挑战是优先、资助和扩大最高影响力的解决方案,认识到资源是有限的。
专家评论
当前的意见领袖和政策文件(如EMA和FDA关于医学中人工智能的指导)呼应了许多这些主题,强调必须以严格的验证和透明的评估框架来部署人工智能。在临床试验中评估人工智能价值的标准化指标缺乏是一个反复出现的关切,同样重要的是持续的利益相关者参与和以患者为中心的方法。最近的评论还指出,如果管理不当,人工智能可能会加剧现有的不平等。所提议框架的局限性包括价值判断的内在主观性和在常规实践中操作复杂的多属性指标的挑战。然而,方向是明确的:没有结构化、以证据为基础的方法,人工智能在临床试验中的低效、不公平甚至反生产性的采纳风险是真实的。
结论
人工智能在变革临床试验方面具有巨大的潜力,但有意义的采纳需要从机会主义实施转向战略性的、以价值为基础的整合。迫切需要一个基于稳健证据并包容多样化利益相关者观点的通用框架来评估、比较和优先排序人工智能解决方案。持续监测、演变数据的综合和道德管理将是确保人工智能在提高试验效率、信息量和可重复性的同时保护参与者福利和研究完整性的重要保障。未来十年的重点不应在于人工智能是否会改变临床试验,而在于如何最好地实现和衡量其最高价值的贡献。
参考文献
1. Mateen BA, Moorthy V, Labrique A, Farrar J. Artificial intelligence and clinical trials: a framework for effective adoption. Lancet Digit Health. 2025 Jul 23:100898. doi: 10.1016/j.landig.2025.100898.
2. 欧洲药品管理局. 关于医药产品生命周期中使用人工智能(AI)的反思文件. EMA/153729/2023.
3. FDA. 医疗器械软件中的人工智能和机器学习. 美国食品药品监督管理局. 更新于2024年.
4. Hutchinson, N ∙ Moyer, H ∙ Zarin, DA ∙ et al. The proportion of randomized controlled trials that inform clinical practice. eLife. 2022; 11, e79491
5. Hutson, M. How AI is being used to accelerate clinical trials, Nature. 2024; 627:S2-S5