亮点
– 一种生成患者特定数字孪生的人工智能驱动决策辅助工具(AI-DA)提高了决策质量(K-DQI),并减少了与单独教育相比的决策冲突和长期后悔。
– 被随机分配到AI-DA组的患者在6-9个月时(KOOS JR)的膝关节特异性功能显著更好,且治疗一致性更高。
– 在即时共享决策评分、3个月膝关节功能、患者或医生满意度、预约时间或TKA接受率方面未观察到差异。
背景
膝关节骨性关节炎(OA)是全球慢性疼痛和残疾的主要原因,也是全膝关节置换术(TKA)的常见适应症。关于TKA的决策是偏好敏感型的:潜在益处(改善疼痛和功能)与风险(并发症、恢复轨迹)之间的平衡因患者而异,取决于个人价值观。共享决策(SDM)和患者决策辅助工具(DAs)可以提高知识水平,使治疗与患者价值观一致,并减少决策冲突,但传统DAs很少纳入个性化、动态的预后信息。
“数字孪生”的概念——一个计算的、数据驱动的虚拟模型,可以模拟个体在不同选择下的结果——有望通过提供定制的风险:益处预测来增强SDM。Jayakumar等人的试验评估了一种从患者报告的结局测量(PROMs)和临床数据生成数字孪生的人工智能驱动决策辅助工具(AI-DA),是否能改善膝关节OA患者考虑TKA时的决策质量、患者报告的结局和SDM体验,与单独教育相比。
研究设计
这是一项在美国单个大学附属骨科诊所进行的随机、开放标签临床试验,时间为2021年2月至2022年11月(ClinicalTrials.gov NCT04805554)。符合条件的患者有膝关节OA并考虑TKA。参与者被随机分配到:
- 干预组:包括患者教育、偏好提取和通过数字孪生模型生成的TKA个性化风险:益处预测的完整AI-DA(分析人数约101人);或
- 对照组:仅患者教育(分析人数约100人)。
主要结局:膝关节骨性关节炎决策质量仪器(K-DQI)。次要/过程结局:CollaboRATE SDM量表、决策冲突量表(DCS)、决策后悔量表(DRS)、3和6个月的KOOS JR(膝关节功能)、患者和医生满意度、预约时间、治疗一致性以及TKA率。部分结局的随访延长至6-9个月。
关键发现
试验随机并分析了201名患者(干预组101人;对照组100人)。基线特征相似(平均年龄约64岁;女性比例约为54%-60%)。
主要结局:决策质量
使用AI-DA的患者在K-DQI上的决策质量得分(均值[标准差] 84.4 [25.2])高于仅教育组(71.4 [29.8]),P = 0.0011。这代表了患者对选项、风险以及治疗与其目标的一致性的理解在统计学和临床上都有显著改善。
决策冲突和后悔
干预组的决策冲突(DCS)得分(1.0 [3.1])低于对照组(3.3 [5.8]),P = 0.0029。6-9个月时,AI-DA组的决策后悔(DRS 18.2 [19.5])也低于对照组(27.2 [24.2]),P = 0.0051。3个月时的后悔没有统计学显著差异。
膝关节功能和临床结局
6-9个月时,通过KOOS JR测量的膝关节特异性健康状况在AI-DA组(69.5 [17.3])优于对照组(47.0 [18.4]),P < 0.0001。这一差异较大,表明使用个性化决策辅助工具的患者的中期患者报告结局有所改善。3个月时,两组的KOOS JR评分相似。
共享决策、满意度、预约时间和手术率
CollaboRATE评分(SDM的简短测量指标)在两组间无差异,患者或医生满意度或预约时间亦无差异。重要的是,TKA率相似,表明AI-DA改变了决策的质量和随后的功能结局,而不仅仅是增加或减少手术利用率。干预组的治疗一致性(接受与其声明偏好一致的护理的患者比例)更高(91%)与对照组(76%)相比,P = 0.0043。
效应大小的解释
K-DQI的改善和决策冲突及晚期后悔的减少表明,个性化预后信息增强了患者的决策过程。6-9个月时KOOS JR的显著差异表明,高质量、偏好一致的选择可能带来下游临床益处;然而,单一中心试验无法确定因果关系,机制需要进一步探索。
专家评论和背景
临床背景:对于如TKA这样的偏好敏感型决策,共享决策是患者中心化护理的基石。高质量的DAs一致地增加知识并减少决策冲突(Cochrane综述)。本研究通过将AI驱动的个性化预后建模整合到DAs工作流程中,推进了该领域的发展——将数字孪生概念操作化,以在临床会诊期间提供个性化的结果轨迹。
数字孪生如何增加价值?
通用的风险和益处信息不考虑患者异质性。数字孪生可以结合年龄、基线功能、合并症、既往PROMs和其他临床变量,估计该个体的可能结果和并发症。理论上,更相关的预测可以提高患者期望的准确性,并使护理与他们的目标更加一致,这两者都与更好的患者报告结局和更低的后悔相关。
试验的优势
- 随机设计,具有基于实际诊所的实施。
- 使用经过验证的决策质量、冲突和后悔量表以及患者报告的膝关节功能测量指标。
- 在过程(决策质量、一致性)和中期结局(KOOS JR)措施方面均有显著改善。
局限性和普遍性
关键局限性包括单中心进行和开放标签设计。总结形式中未充分描述具体的AI模型、训练数据和外部有效性;模型在不同人群中的表现需要独立验证。6-9个月时KOOS JR的意外大差异需要谨慎解读:潜在解释包括(1)治疗与患者偏好的更好匹配,(2)依从性或参与度的差异,或(3)未测量的混杂因素。需要在多中心试验中复制并在更多社会经济和种族多样化人群中评估。
监管、伦理和实施考虑
在临床会诊中嵌入AI预后预测引发了关于透明度、可解释性和模型错误责任的问题。有效实施需要向患者明确解释模型不确定性,定期监测性能,并在新数据积累时更新路径。临床医生培训也是必不可少的,以将个性化预测整合到共享讨论中,而不是取代临床医生的判断。
临床意义和下一步行动
这项试验证明,使用数字孪生预测的AI增强型DAs可以在不增加咨询时间或改变手术率的情况下,显著改善考虑TKA的患者的决策质量和中期功能。对于考虑这些工具的临床医生和卫生系统,优先事项应包括:
- 在不同环境和人群中独立外部验证预测模型。
- 评估长期结局、成本效益和潜在的非预期影响(例如,在亚组中的不公平表现)。
- 制定模型透明度、患者沟通不确定性和与电子健康记录集成的标准。
结论
Jayakumar等人的随机试验表明,生成患者特定数字孪生的人工智能驱动决策辅助工具可以提高膝关节OA患者考虑TKA时的决策质量,减少决策冲突和晚期后悔,并显著改善6-9个月的膝关节功能。这些发现支持在偏好敏感型外科决策中进一步研究个性化、数据驱动的决策支持,同时强调需要更广泛的验证、模型性能的透明报告和谨慎实施,以确保公平受益。
资金和试验注册
资金来源:医疗保健研究与质量机构资助(R21HS027037)。ClinicalTrials.gov注册号:NCT04805554。
参考文献
1. Jayakumar P, Rathouz PJ, Lin E, Trutner Z, Uhler LM, Andrawis J, Koenig KM, Tsevat J, Bozic KJ. 使用数字孪生进行膝关节骨性关节炎护理中的共享决策:一项关于人工智能驱动决策辅助工具与单独教育在决策质量、身体功能和用户体验方面的随机临床试验。EClinicalMedicine. 2025年10月4日;89:103545。doi: 10.1016/j.eclinm.2025.103545。PMID: 41112505;PMCID: PMC12528923。
2. Stacey D, Légaré F, Lewis K, Barry MJ, Bennett CL, Eden KB, Holmes-Rovner M, Llewellyn-Thomas H, Lyddiatt A, Thomson R, Trevena L. 面临健康治疗或筛查决策的人群的决策辅助工具。Cochrane Database Syst Rev. 2017年4月12日;4(4):CD001431。
3. Elwyn G, Frosch D, Thomson R, Joseph-Williams N, Lloyd A, Kinnersley P, Cording E, Tomson D, Dodd C, Rollnick S, Edwards A. 共享决策:临床实践模型。J Gen Intern Med. 2012年10月;27(10):1361-1367。
4. Barry MJ, Edgman-Levitan S. 共享决策——以患者为中心的护理的顶峰。N Engl J Med. 2012年3月1日;366(9):780-781。
5. Topol EJ. 高性能医学:人类和人工智能的融合。Nat Med. 2019年1月;25(1):44-56。
文章缩略图的AI图像提示
一名医生和一位中年患者坐在诊所桌前,查看显示逼真的3D膝关节模型和结果概率图的平板电脑;患者看起来很投入,医生指向平板电脑;温暖自然的诊所照明;逼真、高细节、专业的医疗环境。

