亮点
– 一个AI模型(ATTRACTnet)结合了心电图波形、超声心动图测量值、人口统计数据和骨科诊断代码,在内部和外部测试集中对ATTR-CM表现出强大的区分能力(AUC ≈0.82–0.85)。
– 在一项多中心、单臂临床实施中,AI引导的病例发现识别出1471名评分阳性的患者;50人进行了诊断测试,其中24人(48%)被确诊为ATTR-CM——比历史对照组高2.8倍。
– 大多数新诊断的患者(88%)迅速开始了疾病修饰治疗;研究作者强调需要进行随机试验以评估下游临床益处。
背景:疾病负担和未满足的需求
转甲状腺素心脏淀粉样变性(ATTR-CM)越来越被认为是老年人心力衰竭伴保留或轻度降低射血分数和左室壁增厚的重要且可治疗原因。随着疾病修饰疗法如tafamidis的可用性,早期和准确诊断的临床紧迫性得到了提升。然而,ATTR-CM仍被低估:表现多样,许多受影响的患者被误诊为高血压性心脏病或主动脉瓣狭窄。常规病例发现依赖于临床怀疑、靶向成像(骨闪烁显像)和实验室排除单克隆蛋白,这些方法通常使用不足。
研究设计和方法
Jain及其同事(JAMA Cardiology, 2025)开发并测试了一个AI增强的临床项目(ATTRACTnet),以提高ATTR-CM的检测率。该工作分为两个阶段:(1)模型开发和验证;(2)单系统、多中心、单臂开放标签实施试验,以评估现实世界的性能。
模型输入包括原始心电图波形、超声心动图测量值(非原始图像)、患者人口统计数据和与系统性淀粉样变性相关的骨科诊断代码(例如,腕管综合征)。训练使用来自大型转诊中心的数据,采用5折交叉验证(内部测试集n=799;平均年龄75.1岁,64.7%为男性),外部验证使用独立的学术机构(外部测试集n=422)。实施的主要结果是根据共识标准诊断ATTR-CM(非侵入性心脏闪烁显像加上适当的实验室评估或必要时的活检)。
实施阶段的资格标准集中在左室(LV)壁厚度增加(≥12 mm)且ATTRACTnet评分≥0.5的患者。排除标准包括既往ATTR检测、已知肥厚型心肌病、预期寿命<1年、养老院居住或重度痴呆,以及当厚度<14 mm时LV增厚有明确解释(例如,未控制的高血压或明显的主动脉瓣狭窄)。
关键发现
模型性能:ATTRACTnet在内部交叉验证中对ATTR-CM表现出良好的区分能力,AUC为0.85(范围为0.77–0.85),在外部测试集中为0.82(95% CI, 0.81–0.83)。据报道,主要种族/民族群体(西班牙裔、非西班牙裔黑人、非西班牙裔白人)之间的表现相似,表明在现有数据中的亚组间具有可接受的校准。
实施和诊断率:在研究期间,AI管道标记了1,471名评分为≥0.5的患者。应用资格标准后,256名患者符合外展条件;50名患者在医生和患者同意后完成了确认性诊断测试(核闪烁显像和单克隆蛋白测试)。在这些测试中,24人(48%)符合ATTR-CM的共识标准。这一诊断阳性率比历史对照组(15.3%;95% CI, 13.1%–17.9%;P < .001)高2.8倍。相对于前一年,该医疗系统内的新ATTR-CM诊断增加了18%。
治疗启动:在新诊断为ATTR-CM的患者中,24人中有21人(88%)在三个月内开始特定疾病的治疗(例如,tafamidis),这表明大多数情况下检测迅速转化为治疗行动。
安全性和危害:报告的重点是诊断率和后续治疗的启动,而不是归因于筛查的不良事件。没有描述筛查过程本身直接造成的伤害信号,但资源利用和潜在的过度检测(假阳性)仍然是相关考虑因素。
解读和临床意义
这项研究表明,集成到临床项目的多模态AI模型可以高效地识别那些原本不会被检测的高可能性ATTR-CM患者。两个特点加强了其实用相关性:模型使用常规收集的数据元素(心电图波形、超声心动图测量值、人口统计数据、诊断代码),并且实施触发了现实世界的诊断路径(PYP/DPD闪烁显像和单克隆蛋白评估)。
从临床角度来看,测试患者中近50%的阳性率是显著的;这比无导向的筛查方法更有优势,表明AI可以将诊断资源集中在收益最高的地方。大多数诊断患者的快速治疗启动进一步支持了临床效用,因为早期治疗被认为可以减缓疾病进展并减少发病率。
与现有实践和先前证据的比较
早期的研究表明,重点筛查(例如,老年人群中左室壁增厚、腕管综合征或传导障碍)可以识别以前未被认识的ATTR-CM。这项研究的新颖之处在于展示了自动化、算法驱动的管道,该管道整合了多种数据模式,以优先在医疗系统中对患者进行测试,而不仅仅是依赖个别医生的怀疑。
优势
– 多模态模型设计利用了常见的数据元素,增加了潜在的可扩展性。
– 外部验证支持了超出推导站点的通用性。
– 现实世界的实施数据提供了诊断率和即时治疗采纳的实用证据。
– 报告的多个种族/民族群体之间的类似表现解决了AI模型常见的公平性问题(尽管需要持续评估)。
局限性和注意事项
– 这是一项非随机、单臂实施研究;增加的检测率不能因果归因于AI干预而非同时期的趋势,除非进行随机对照比较。
– 只有256名符合条件的患者中有50人接受了诊断测试,引发了关于测试障碍(医生/患者接受度、物流或竞争性临床优先事项)和潜在选择偏差的问题——接受测试的患者可能具有更高的术前概率。
– 使用的阈值(评分≥0.5)和资格规则影响了产量和资源需求;可能需要针对不同的医疗系统或人群进行优化。
– 该研究强调了诊断率,但没有提供长期结果数据证明通过AI筛查早期检测是否改善了发病率、死亡率、生活质量或成本效益。
– 在非学术或资源有限的环境中推广需要进一步研究;闪烁显像和专科护理的获取仍然是实施障碍。
专家评论和未来方向
这些发现及时:随着有效的ATTR-CM治疗方法的出现,改善早期检测具有临床意义。基于AI的病例发现可以减少仅依赖医生怀疑的情况,多模态模型结合心电图和超声心动图特征以及相关的非心脏信号(骨科诊断)反映了转甲状腺素淀粉样变性的系统性质。
关键的下一步包括:随机对照评估比较AI增强筛查与常规护理,以量化对临床有意义的结果(住院、功能状态、生存)和健康经济学的影响;在不同的医疗系统中部署研究以测试可扩展性和公平性;阈值优化以平衡敏感性、特异性和资源使用;以及评估以患者为中心的结果,包括筛查和诊断级联的危害的心理影响。
结论
ATTRACTnet是一个有前途的AI增强病例发现的例子,适用于一种可治疗的心肌病。在这项非随机多中心实施中,该项目在新诊断的患者中产生了高诊断率和快速治疗启动。然而,非随机设计、部分测试采纳和缺乏结果数据意味着需要随机试验和更广泛的实施研究来确认不同环境下的临床益处、成本效益和公平表现。
资助和试验注册
试验注册:ClinicalTrials.gov Identifier: NCT06469372。
资金和详细披露见原始出版物(参见Jain SS等,JAMA Cardiology, 2025)。
选定参考文献
1. Jain SS, Sun T, Pierson E, et al. Detecting Transthyretin Cardiac Amyloidosis With Artificial Intelligence: A Nonrandomized Clinical Trial. JAMA Cardiol. 2025 Nov 10:e254591. doi: 10.1001/jamacardio.2025.4591.
2. Maurer MS, Schwartz JH, Gundapaneni B, et al. Tafamidis Treatment for Patients with Transthyretin Amyloid Cardiomyopathy. N Engl J Med. 2018;379(11):1007-1016. doi:10.1056/NEJMoa1805689.
