初级保健中的AI听诊器:为什么实施科学比算法准确性更重要

初级保健中的AI听诊器:为什么实施科学比算法准确性更重要

亮点

TRICORDER试验是一项在英国进行的大规模集群随机研究,发现将AI听诊器纳入常规初级保健并未显著增加新编码的心力衰竭诊断率(IRR 0.94;95% CI 0.86-1.02)。

尽管AI听诊器算法在心力衰竭、心房颤动和瓣膜性心脏病的诊断准确性方面已得到证明,但其在人群层面的影响受到实际应用挑战和临床医生采用率的限制。

该研究强调了技术性能与临床效用之间的关键差距,强调数字健康工具的成功不仅取决于算法的敏感性,还取决于工作流程的整合。

背景:未诊断心血管疾病的负担

心血管疾病(CVD)仍然是全球死亡和致残的主要原因。在CVD谱系中,心力衰竭(HF)、心房颤动(AF)和瓣膜性心脏病(VHD)是重要的公共卫生挑战。早期诊断至关重要;然而,这些疾病在早期阶段往往无症状或表现为非特异性症状,导致错失基于证据的干预机会,这些干预可以预防住院和死亡。

传统的听诊器虽然具有标志性,但对于检测早期心力衰竭或复杂的瓣膜病理学的敏感性有限,特别是在非专科医生手中。结合数字心音图(PCG)和单导联心电图(ECG)的人工智能听诊器作为一种有前途的解决方案出现。这些设备使用深度学习算法在护理点识别结构性和功能性心脏异常。尽管在受控环境中表现良好,但其在繁忙的初级保健环境中提高诊断率的有效性直到TRICORDER试验才得到验证。

研究设计和方法

TRICORDER试验是一项在英国初级保健机构进行的实用集群随机对照实施试验。选择这种设计是为了反映国家卫生服务(NHS)的复杂性,并评估创新在融入现有临床工作流程时的表现。

人群和随机化

2023年10月至2024年5月期间,205家初级保健机构被随机分配。干预组包括96家机构(代表701,933名注册患者),而对照组包括109家机构(代表851,242名注册患者)。在干预组中,临床医生接受了AI听诊器的培训,并被鼓励在常规心脏检查中使用它。对照组继续使用传统方法进行常规护理。

干预措施:AI听诊器技术

试验中使用的AI听诊器记录了15秒的单导联ECG和PCG信号。这些数据由三个监管批准的AI算法处理,旨在提供二元预测:
1. 左室射血分数降低(LVEF ≤40%)。
2. 心房颤动。
3. 瓣膜性心脏病。
临床医生通过设备或配对应用程序立即获得反馈,从而在患者就诊期间提供即时的临床决策支持。

终点

主要终点是每1000患者年任何新编码的心力衰竭(所有亚型)诊断率,数据来源为NHS安全数据环境。次要终点包括AF和VHD的检出率、AI工具的诊断性能特征以及临床医生报告的实施障碍和促进因素的定性评估。

关键发现:AI是否提高了检出率?

TRICORDER试验的结果提供了对将高科技工具转化为公共卫生成果所面临挑战的冷静审视。在意向治疗(ITT)分析中,AI听诊器的实施并未导致心力衰竭检出率的统计学显著增加。发病率比(IRR)为0.94(95% CI 0.86-1.02),表明干预组和对照组之间没有差异。

按设置检出

在诊断地点上没有显著差异。希望AI听诊器能够将诊断从急性住院(晚期)转移到社区诊所(早期)并未实现(p>0.05)。这表明,仅仅提供工具并没有根本改变已经出现症状或处于风险中的患者的就诊路径。

利用和诊断关联

深入数据分析显示,972名临床用户进行了12,725次AI听诊器检查。有趣的是,当设备实际使用时,其预测与心力衰竭、AF和VHD的显著较高检出率独立相关。这产生了一个悖论:工具在使用时有效,但其引入系统并未改变总体人口诊断率。这种差异指向了实施中的“剂量-反应”问题——相对于总人口,AI辅助检查的数量可能太低,无法影响主要终点。

专家评论:弥合性能与实践之间的差距

TRICORDER试验是一个里程碑式的研究,不是因为它展示了巨大的益处,而是因为它准确地映射了经过验证的算法与成功临床结果之间的“死亡谷”。医学文献中充斥着研究表明AI在读取图像或信号方面可以超越临床医生;然而,TRICORDER表明,“性能”并不等于“实施”。

实施障碍

临床医生报告的数据确定了几项可能阻碍试验成功的障碍。初级保健的时间限制非常严重;增加15秒的记录时间加上解释和采取行动的时间可能是10分钟咨询中的重大障碍。此外,关于应筛查哪些患者可能存在模糊性。如果没有强制性的筛查协议,临床医生可能只在已经怀疑患者有心脏问题时使用该设备,从而未能发现理论上该技术最擅长找到的“沉默”病例。

优势和局限性

该研究的优势包括其大规模和实用的现实世界设计,使用NHS数据。它避免了高度控制的诊断准确性研究中的“象牙塔”偏见。然而,缺乏盲法(在这种设计中不可避免)和相对较短的12个月随访期可能限制了长期诊断编码变化的可见性。此外,试验未规定特定的筛查频率,将使用情况留给临床医生自行决定。

结论:数字健康的未来之路

TRICORDER试验为未来医学中的AI提供了重要的案例研究。它表明,拥有准确的工具只是第一步。为了使AI听诊器改善公共健康,必须伴随强大的实施策略,解决临床医生的工作流程、明确的患者选择指南,或许还需要向主动筛查转变,而不是被动实施。尽管主要终点未达到,但设备使用与疾病检出之间的关联表明,如果能克服使用障碍,这项技术仍然是一种强大的资产。未来的研究应集中在优化“人机”界面,确保这些强大的诊断见解能够惠及最需要的患者。

资金和临床试验信息

TRICORDER试验由国家卫生和保健研究所(NIHR)、英国心脏基金会和帝国健康慈善机构资助。试验已在英国国家卫生服务安全数据环境协议中注册。

参考文献

1. Kelshiker MA, et al. 通过人工智能听诊器(TRICORDER)在英国检测三种心血管疾病:一项集群随机对照实施试验。Lancet. 2026;407(10529):704-715。

2. Bächtiger P, et al. 人工智能在心力衰竭检测中的应用:诊断准确性系统评价。European Heart Journal – Digital Health. 2023。

3. Lloyd-Jones DM, et al. 美国心脏协会:2023年心脏病和中风统计数据更新。Circulation. 2023。

Comments

No comments yet. Why don’t you start the discussion?

发表回复