亮点
• 人工智能应用于标准12导联心电图,能够良好地预测未来的中度至重度反流性瓣膜心脏病(rVHD)——包括二尖瓣反流(MR)、三尖瓣反流(TR)和主动脉瓣反流(AR),并在风险四分位数之间显示出较大的危险梯度。
• 在中国近一百万对心电图-超声心动图配对数据(400,882名患者)上训练的模型,在Beth Israel Deaconess医疗中心(34,214名患者)的跨国外部队列中保持了性能。
• AI-ECG预测与影像学上的亚临床腔室重塑相关,支持其生物学合理性及其在指导监测超声心动图中的潜在用途。
背景和疾病负担
反流性瓣膜心脏病(rVHDs)——包括二尖瓣反流、三尖瓣反流和主动脉瓣反流——对心力衰竭、心律失常、住院和过早死亡有显著贡献。及时识别进展性瓣膜病和心室或心房重塑至关重要,因为有针对性的监测和及时干预可以改变结局。然而,人群水平的超声心动图筛查资源密集且常常不切实际。标准12导联心电图(ECG)广泛存在、价格低廉且在许多临床环境中常规采集。最近的研究表明,深度学习应用于心电图可以比临床识别更早地检测左心室功能障碍和其他结构和节律异常。梁等人的这项研究扩展了这一范式,旨在预测未来的临床显著rVHD,提供一种低成本的分诊工具,以指导超声心动图监测和早期干预计划。
研究设计
作者使用在上海中山医院组装的大量纵向配对数据库(988,618对心电图-超声心动图记录,来自400,882名独特患者)开发了AI-ECG模型。建模方法采用了带有离散时间生存损失函数训练的残差卷积神经网络(CNN)架构,使时间-事件预测成为可能,而不仅仅是横断面分类。
外部验证使用了来自波士顿Beth Israel Deaconess医疗中心(BIDMC)的跨国队列——一个包含34,214名患者的二级护理门诊数据集,其中链接了超声心动图。主要结果是根据超声心动图定义的未来中度或重度MR、TR和AR的发展。性能指标包括用于时间-事件区分的一致性(C指数)和调整年龄和性别后的Cox比例风险模型,以比较风险分层。
关键发现
模型区分能力和风险分层
在内部(上海)测试集中,AI-ECG模型对未来中度至重度rVHD的区分能力如下:
- 二尖瓣反流(MR):C指数 0.774(95% CI 0.753–0.792)
- 主动脉瓣反流(AR):C指数 0.691(95% CI 0.657–0.720)
- 三尖瓣反流(TR):C指数 0.793(95% CI 0.777–0.808)
当按预测风险四分位数分层时,调整后的Cox模型显示最高四分位数与最低四分位数相比,危险显著增加:
- MR:危险比(HR)7.6(95% CI 5.8–9.9;P < .0001)
- AR:HR 3.8(95% CI 2.7–5.5)
- TR:HR 9.9(95% CI 7.5–13.0)
这些梯度表明,由AI-ECG模型标记的亚组具有高度的风险集中。
外部(跨国)验证
重要的是,作者报告了在BIDMC队列中的发现确认,这是一个种族和地理上不同的门诊人群。跨人群保持的区分性能支持该方法的稳健性和超出原始训练环境的潜在普遍性。
成像关联和生物学合理性
次要分析将AI-ECG预测与亚临床腔室重塑的影像学标志物(例如,左心房或心室增大或功能障碍)联系起来,表明基于心电图的信号与已知先于临床明显瓣膜功能障碍的早期结构变化相关。这加强了模型检测真实病理生理底物的合理性,而不仅仅是数据集伪影。
安全性和可解释性
该研究侧重于预后区分,并未直接引起对心电图模式的安全性担忧。然而,预测算法的临床部署有下游影响:假阳性会增加超声心动图工作量和焦虑;假阴性可能会延迟监测。作者使用了时间-事件建模而不是简单的二元标签,这支持了更细致的风险沟通和监测安排。
专家评论和背景
这些发现与先前研究表明深度学习可以在标准心电图中揭示结构性心脏病特征的工作一致。值得注意的例子包括AI-ECG检测左心室射血分数降低和预测心律失常风险。目前的研究将这些应用扩展到了瓣膜反流病变,并且重要的是,训练模型预测未来事件而不仅仅是当前疾病。这种时间元素对于AI-ECG用于前瞻性监测至关重要。
研究的优势包括巨大的配对数据集,使学习细微的心电图-超声关系成为可能;使用生存导向的损失函数;以及跨国验证。与亚临床重塑相关的证据支持生物有效性,而不仅仅是过度拟合特定地点的实践模式。
关键限制和考虑因素:
- 人群选择:开发和测试数据集都是与超声心动图相关的队列。在促使进行超声检查的情境下进行的心电图可能与一般人群的心电图不同。在真正未经选择的社区筛查人群中评估性能需要前瞻性评价。
- 病例组合和患病率:不同卫生系统中进展性rVHD的患病率和超声检查的阈值不同,这会影响阳性预测值和在新设置中的操作实用性。
- 黑箱行为和校准:深度网络可能校准不良;临床医生需要明确的校准指标、决策阈值以及AI评分如何映射到监测间隔的指导。可解释性方法可以帮助但不能替代前瞻性验证。
- 临床影响:证明早期检测的改善是一个重要的第一步;然而,展示AI引导的监测是否减少发病率、延缓进展或改善以患者为中心的结果需要前瞻性实施试验或实用随机研究。
临床和实施意义
经过验证的AI-ECG rVHD预测模型的潜在用例包括:
- 风险分层监测:优先为AI预测高风险的患者进行超声心动图,可能比常规实践更有效地早期检测进展性反流。
- 初级保健分诊:在初级保健或术前环境中,心电图访问受限的情况下,AI-ECG可以识别需要紧急转诊的患者。
- 与电子健康记录集成:常规心电图的自动评分可以触发指南一致的工作流程(例如,当超过阈值时提前安排超声心动图),但这些路径需要精心设计以避免过度检查。
在广泛部署之前需要解决的操作问题包括可行动的风险阈值选择、随访间隔、临床医生通知策略以及成本效益——特别是早期检测与额外成像资源使用的平衡。
下一步和研究重点
为了将这些模型转化为实践,以下事项是优先考虑的:
- 在未经选择的门诊和初级保健队列中进行前瞻性验证,以测量现实世界的性能和校准。
- 评估AI引导监测是否减少检测时间、改变管理(例如,干预时机)或改善临床结果的随机或实用实施研究。
- 健康经济学分析,确定每例检测的成本和对资源利用的下游影响。
- 监管和公平性评估,确保算法在不同的人口统计和社会经济群体中表现良好;关于训练数据的透明度和性能漂移的监测是必要的。
- 开发面向临床医生的决策辅助工具,将AI风险评分转化为符合瓣膜病管理指南的具体监测建议。
结论
梁等人提供了令人信服的证据,表明人工智能应用于常规12导联心电图可以良好地预测未来的中度至重度反流性瓣膜病,并且具有较大的风险梯度。大量的训练集、生存感知建模和跨国外部验证增强了对信号的信心。如果在未经选择的人群中前瞻性验证并证明可以改善具有临床意义的结局和工作流程效率,AI-ECG可能成为优先进行超声心动图和识别早期干预患者的实用、低成本工具。目前,这些模型应被视为前景看好的决策支持工具,需要前瞻性实施研究和与临床路径及指南建议的谨慎整合。
资助和clinicaltrials.gov
资助和试验注册详情见主要出版物(Liang et al., Eur Heart J. 2025)。读者应参考源文章获取资助和注册信息。
关键参考文献
1. Liang Y, Sau A, Zeidaabadi B, et al. Artificial intelligence-enhanced electrocardiography to predict regurgitant valvular heart diseases: an international study. Eur Heart J. 2025 Nov 21;46(44):4823–4837. doi:10.1093/eurheartj/ehaf448.
2. Attia ZI, Noseworthy PA, Lopez-Jimenez F, et al. Screening for cardiac contractile dysfunction using an artificial intelligence–enabled electrocardiogram. Nat Med. 2019;25(1):70–74. doi:10.1038/s41591-018-0240-2.
3. Raghunath S, Feduscak S, Kwon D, et al. Deep neural networks can predict cardiovascular risk from electrocardiograms. Nat Med. 2020;26(9):1334–1339. doi:10.1038/s41591-020-0970-7.
4. Otto CM, Nishimura RA, Bonow RO, et al. 2020 ACC/AHA Guideline for the Management of Patients with Valvular Heart Disease. Circulation. 2020;142(24):e352–e454.

