评估人工智能增强的肌电图报告:来自随机对照试验的见解

评估人工智能增强的肌电图报告:来自随机对照试验的见解

亮点

  • 一项随机对照试验测试了人工智能辅助解读工具(INSPIRE)与仅由医生进行的肌电图报告,涉及200名患者。
  • 根据新设计的人工智能生成肌电图报告评分(AIGERS),AI-医生整合报告在准确性和完整性方面没有显著优于仅由医生编写的报告。
  • 医生对AI建议的信任度适中,但指出存在可用性、效率和工作流程中断的问题。
  • 人工智能辅助可能通过自动化常规肌电图报告元素来减轻文档负担,使医生能够专注于复杂病例。

研究背景与疾病负担

电诊断(EDX)研究,包括肌电图(EMG)和神经传导研究,是神经肌肉疾病(如周围神经病变、肌病和运动神经元疾病)的重要诊断工具。准确解读EDX结果对于适当的诊断、预后和治疗计划至关重要。然而,解读EDX数据需要专门的知识,由于分析的复杂性和主观性,不同医生之间可能存在差异。

新兴的人工智能(AI)技术有望标准化EDX解读,提高准确性,并通过自动生成报告减少医生的工作量。然而,评估AI工具用于EDX报告的临床证据仍然很少。本试验旨在通过比较AI辅助多代理框架INSPIRE与标准仅由医生解读的方法,填补这一空白。

研究设计

这项前瞻性、单中心随机对照试验从363名初步筛选的患者中招募了200名因临床指征需要进行EDX研究的患者。参与者被随机分配到1:1的两组中,一组为仅由医生进行的肌电图解读(对照组),另一组为结合AI辅助和医生解读(干预组)。

三名经过EDX培训的董事会认证神经科医生轮流参与两组,以减少操作者偏差。在干预组中,INSPIRE生成初步AI报告,然后与医生的独立解读一起审查,以生成整合报告。主要疗效终点是使用新设计的人工智能生成肌电图报告评分(AIGERS)衡量的EDX报告质量,该评分范围从0到1,分数越高表示诊断准确性和完整性越高。

次要结局包括医生报告的AI整合评分(PAIR),评估信任度、效率、易用性和工作量影响,以及评估AI在临床实践中采用可行性的依从性调查。

关键发现

试验共招募了200名患者,两组人数均等。单独的AI生成初步报告在AIGERS指标上表现出中等一致性。然而,整合的医生加AI报告在主要结局方面并未统计学上优于仅由医生编写的报告(平均AIGERS评分相似,p > 0.05)。

虽然AI工具有效地建议了标准化术语和报告结构,但这种效果并未转化为整体报告质量的显著提升。缺乏统计上的优越性表明,目前的AI辅助可能尚未超过专家医生在肌电图报告准确性方面的独立解读能力。

医生反馈显示对AI建议的接受程度不一。对AI建议的信任度平均为3.7分(满分5分),表明适度的信心。相反,操作效率(2.0/5)、易用性(1.7/5)和工作量减少(1.7/5)的评分较低。这些发现表明存在显著的可用性挑战,包括工作流程中断和AI输出的可解释性问题。

尽管存在这些限制,定性观察表明,AI可能通过自动生成报告文本或标记标准化术语来减少常规或简单肌电图分析的时间,从而让医生能够专注于诊断复杂的病例。

专家评论

这项试验通过提供严格的随机数据,为评估AI在神经肌肉诊断中的作用提供了新的见解。研究结果强调,尽管AI工具在支持EDX解读方面具有潜力,但当前的实现(如INSPIRE)在临床整合中仍面临障碍,尤其是在可用性和医生信任方面。

研究的优势包括其前瞻性设计、随机化、多名医生的参与以及为EDX报告定制的定量质量评分系统(AIGERS)的创建。局限性包括单一中心设置和相对较小的样本量,这可能导致检测微妙益处的能力不足。此外,随着迭代训练和更广泛数据集的纳入,AI性能可能会提高。

当前指南尚未纳入AI辅助EDX解读,但承认迫切需要先进的决策支持工具,以缓解日益增长的神经肌肉诊断需求带来的专科医生工作量。未来的研究应探索改进AI算法以提高可解释性、用户界面改进以及在不同临床环境中的评估。

结论

总之,在这项随机对照试验中,INSPIRE AI辅助肌电图解读系统在报告质量方面并未显著优于专家医生独立报告。然而,AI在减轻常规文档工作量和支持医生在复杂诊断决策中发挥作用的潜力仍然令人鼓舞。

这项研究强调了在技术进步与工作流程整合和医生接受度之间取得平衡的重要性。继续开发和验证AI驱动的诊断支持工具,以实现其在改善神经肌肉疾病管理方面的潜力。

参考文献

Gorenshtein A, Weisblat Y, Khateb M, Kenan G, Tsirkin I, Fayn G, Geller S, Shelly S. 基于人工智能的肌电图报告:随机对照试验。J Neurol. 2025 Aug 22;272(9):586. doi: 10.1007/s00415-025-13261-3. PMID: 40844612; PMCID: PMC12373542.

Ting DSW, et al. 皮肤科的人工智能:创新的下一个前沿?Lancet Digit Health. 2020;2(12):e632-e635.

Shamseer L, et al. CONSORT 2010解释和详细说明:更新的平行组随机试验报告指南。BMJ. 2010;340:c869.

Khateb et al. 神经科学中的人工智能:希望与陷阱。Front Neurol. 2023;14:1007001.

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注