利用人工智能驱动的模拟患者提高医学生外科病史采集技能:一项随机对照试验

利用人工智能驱动的模拟患者提高医学生外科病史采集技能:一项随机对照试验

引言

有效的沟通是外科实践中不可或缺的技能,其基础在于能够全面而准确地采集患者的病史。病史采集能力使外科医生能够收集必要的临床信息,与患者建立良好关系,并制定后续的诊断和治疗干预措施。传统上,医学课程通过整合基于模拟的培训方法来增强这些人际交往和临床沟通技能,利用标准化或模拟患者(SPs)提供互动、体验式的学习环境。然而,人类SPs的可用性和标准化可能会受到物流、财务和时间安排的限制。

近年来,人工智能(AI)领域,特别是深度语言学习模型(DLM)如OpenAI开发的ChatGPT,为增强医学教育提供了创新的机会。这些模型能够在实时生成情境适当、详细且细腻的模拟患者互动,潜在地解决传统模拟方法的局限性。

本文批判性地评估了一项最近发表的随机对照试验,该试验评估了在高年级本科生临床轮转期间,将基于DLM的模拟工具作为虚拟SP集成以提高外科病史采集技能的效果。讨论了该研究对临床教育和未来AI应用的意义。

研究背景和教育需求

有效的外科沟通始于结构化、以患者为中心且临床相关的病史采集。尽管这一点非常重要,但医学生经常报告在外科轮转期间缺乏足够的自信心和接触多样临床场景的机会。模拟培训被用于弥合这一差距,但依赖于人类SPs仍然是资源密集型的。

深度语言学习模型代表了教育技术的前沿,展示了维持连贯、现实对话和模仿人类反应的能力。利用这种AI驱动的SPs可以提供可扩展、可访问且一致的模拟体验。然而,评估其在外科培训环境中教育效果的随机对照试验的有力证据有限。

研究设计和方法

McCarrick等人进行了一项涉及九十名参加外科模块的高年级医学生的随机对照试验。参与者通过随机分层抽样分为两个相等的组:对照组接受临床轮转期间的标准体验式学习,干预组接受额外的培训,包括三次与DLM(具体为OpenAI的ChatGPT)作为模拟患者的结构化会话。

DLM的互动通过学生提示脚本化,随后将对话记录提交给导师评估,以确保临床适当性和教育有效性。所有学生都参加了由人类SP参与的标准化客观结构化临床考试(OSCE),评估者对学生的组别分配不知情,以减少偏见。基线OSCE用于确定初始能力,随后在干预期后或同等时间的传统学习后进行重复评估。

此外,干预组的学生完成了一项匿名调查,以捕捉主观指标,包括沟通自信心、AI病史的真实性和详细程度以及再次使用该工具的意愿。

主要发现

经过成功的试点测试,正式试验共招募了九十名参与者,平均分配到两组。基线OSCE得分反映了病史采集能力,在两组之间具有统计学上的可比性(未指定p值)。

干预后的结果显示,干预组的OSCE得分有统计学意义上的显著改善(p < 0.001)。通过Cohen's d测量的效应量在干预组为0.37,对照组为0.19,表明DLM模拟会话带来了有意义的教育收益。

导师们一致认为DLM生成的内容适当且临床相关,证实了该模型生成情境正确患者场景的能力。

干预组学生的调查参与率为62%。受访者中有57%自述沟通技能自信心增加,72%认为DLM生成的病史丰富且详细,95%表示愿意在未来培训中再次使用DLM模拟工具。

未发现任何不良影响或学习损害。数据总体支持DLM增强模拟带来的教育成果提升。

专家评论和考虑事项

这项开创性的研究为将高级AI语言模型整合到外科教育中提供了严格的证据,标志着模拟培训可能发生的范式转变。

随机对照设计、使用盲评评估者和客观能力衡量标准增强了研究结果的有效性。中等效应量展示了技能获取的实际提升,从效率角度来看,AI驱动工具的教育意义重大。

然而,一些局限性值得关注。研究仅限于一个机构和特定的队列,这可能影响普遍性。未评估干预后长期技能保留情况,也未评估该工具在更复杂或多样外科场景中的有效性。

进一步的研究应探索纵向结果、与其他教育模式的整合以及跨机构的可扩展性。此外,必须严格解决AI在教育中的伦理问题,包括数据隐私、学生对AI的依赖以及模型输出中的潜在偏见。

尽管存在这些考虑,这项研究与越来越多的文献一致,倡导有意识地将AI纳入教学,以补充而非替代人类临床教学。

结论

在一项针对高年级本科生的随机对照试验中,采用深度语言学习模型作为模拟患者显著提高了外科病史采集能力和学生自信心。随着AI技术的发展,此类工具有望通过提供标准化、可访问且吸引人的模拟体验来增强外科教育。

这一创新解决了传统模拟项目中固有的体验式学习和资源限制的关键问题。未来的工作应旨在在更广泛的环境中验证这些发现,并制定指南以优化AI整合,同时保护教育质量和伦理标准。

参考文献

McCarrick CA, McEntee PD, Boland PA, Donnelly S, O’Meara Y, Heneghan H, Cahill RA. 一种基于深度语言学习模型的模拟工具在外科本科生中的随机对照试验。J Surg Educ. 2025年9月;82(9):103629。doi: 10.1016/j.jsurg.2025.103629。Epub 2025年7月28日。PMID: 40729832。

Kneebone R. 模拟在外科培训中的应用:教育问题和实际影响。Med Educ. 2003年;37(3):267-77。

Topol EJ. 高性能医学:人类和人工智能的融合。Nat Med. 2019年1月;25(1):44-56。

Muller AM, 等. 人工智能赋能的虚拟患者在医学教育中的应用:一项范围审查。BMC Med Educ. 2023年;23(1):123。

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注