在外科教育中利用人工智能:基于深度语言学习模型的模拟提升本科生病史采集技能

在外科教育中利用人工智能:基于深度语言学习模型的模拟提升本科生病史采集技能

引言

有效的沟通在外科实践中至关重要,病史采集是塑造诊断和管理的基础步骤。传统上,外科教育依赖于体验式学习和标准化患者模拟来培养这些技能。然而,最近在人工智能(AI)领域,特别是OpenAI开发的ChatGPT等深度语言学习模型(DLM),为增强培训方式提供了创新的可能性。

本文批判性地回顾了一项随机对照试验,研究了将DLM作为模拟患者(SP)整合到高年级本科生外科病史采集培训中的效果。还评估了基于模拟的沟通技能培训在知情同意获取和核心临床技能发展方面的相关研究,以在更广泛的教育趋势中定位研究发现。

研究背景与临床环境

良好的外科医生-患者沟通与提高诊断准确性、患者依从性和结果密切相关。然而,传统的师徒模式依赖于无结构的临床暴露,可能无法确保受训者具备一致的胜任力。

基于模拟的医学培训(SBMT),涉及标准化患者和角色扮演,已成为弥补这一差距的有效方法。目前,基于AI的对话代理提供了可扩展、互动且潜在无限的场景,供受训者练习沟通。然而,关于其在医学教育中的有效性的有力证据仍然有限。

手术中次优沟通的负担反映在知情同意挑战、诊断不准确和患者不满意上,强调了需要创新的教育干预措施来补充临床学习。

研究设计

主要研究(McCarrick等人,2025年)采用单中心随机对照试验(RCT)设计,评估DLM模拟对外科病史采集技能的影响。90名参加核心外科模块的高年级医学生通过分层抽样随机分为对照组和干预组(每组45人)。

对照组:接受标准体验式学习,包括常规临床轮转和通常的教学方式。
干预组:除标准学习外,还参加了三次使用ChatGPT作为模拟患者的结构化会话。这些会话由导师进行反馈。

所有参与者在基线和干预后阶段完成了与真人SP的客观结构化临床考试(OSCE)。评估由盲评者进行,以减少偏倚。干预后,干预组学生完成了匿名调查,评估他们的沟通信心和对DLM模拟的看法。

为了全面理解,还考虑了两个相关的RCT:

1. 模拟培训对沟通技能和知情同意的影响(McCarrick等人,2025年)评估了通过导师引导的角色扮演和同伴讨论进行的沟通模拟培训(CST),以提高知情同意能力。
2. 模拟培训对核心技能能力的影响(McCarrick等人,2024年)评估了多周SBMT对外科技能和体格检查熟练度的影响,使用基于演员的模拟和临床评估。

关键发现

1. 基于深度语言模型的模拟试验(McCarrick等人,2025年)
– 在DLM基础上生成的内容在手术病史采集情景中始终适当。
– 基线OSCE得分在两组之间相当,确认了初始能力的平衡。
– 干预后,干预组的OSCE得分显著提高(p < 0.001),教育效应量(Cohen's d)为0.37,而对照组为0.19。
– 调查数据显示,57%的干预组学生报告沟通技能信心增加。绝大多数(72%)认为通过DLM获得的历史记录丰富且详细,95%表示愿意再次使用该工具。

2. 知情同意沟通技能培训的影响(McCarrick等人,2025年)
– 在122名学生中,61名接受了CST。CST参与者在知情同意沟通方面表现出显著的干预后改善,根据都柏林大学学院OSCE评分表和全球沟通评分量表(GCRS)测量。
– CST组的平均成绩从C提高到B+,效应量为0.79,而对照组表现保持不变。
– 沟通领域的多个方面均有所改善,包括开始、口头表达、会话结构和信息传递。
– 获取知情同意的自信心显著提高,从11名学生增加到62名学生。

3. 核心技能能力的模拟培训影响(McCarrick等人,2024年)
– 100名高年级医学生参与,其中一半完成了为期10周的基于演员的SBMT项目,模拟急性腹痛病例。
– 干预组和对照组的基线南安普敦医学评估工具(SMAT)得分相当。
– 经过培训后,干预组的SMAT得分显著提高(p = 0.0006)。
– 学生反馈非常积极:94%认识到好处,85%报告病史采集信心增加,78%注意到腹部检查技能有所提高。

研究 干预措施 结果测量 效应量 关键结果
DLM模拟(McCarrick等人,2025年) 3次ChatGPT SP会话 + 标准学习 OSCE病史采集得分,学生调查 0.37(DLM) vs 0.19(对照组) 显著改善,信心增加,高度接受
沟通技能培训(McCarrick等人,2025年) 导师引导的角色扮演,同伴讨论 OSCE知情同意沟通,GCRS,信心调查 0.79 显著得分增加,信心,技能提升
模拟培训(McCarrick等人,2024年) 10周基于演员的SBMT项目 SMAT临床能力得分,反馈调查 显著改善(p=0.0006) 能力提高,信心增加

专家评论

像ChatGPT这样的DLM的出现,在没有基于演员的SP项目固有的后勤限制的情况下,提供了模拟真实患者互动的前所未有的灵活性。所证明的教育效果支持DLM作为补充工具而非替代人类接触的整合。值得注意的是,DLM干预的效应量小于更传统的CST,但仍具有临床相关性,反映了AI整合的新颖性和早期阶段。

局限性包括依赖文本交互,这可能缺乏临床互动中至关重要的非言语沟通细微差别。此外,结果的普遍性应谨慎对待,因为研究对象仅限于单一机构的高年级医学生。未来试验可以探索结合AI与人类SP的混合模型、多模态交互平台以及与这些教育创新相关的长期临床结果。

当前指南强调了在沟通培训中主动、有意识练习的重要性;DLM模拟提供了一个实用的环境,用于此类重复学习并即时反馈,使其成为外科课程中有前途的辅助工具。

结论

基于深度语言学习模型的模拟整合显著提升了外科病史采集技能和学生沟通信心。这项技术代表了传统临床教学模式在本科医学教育中的可扩展、可行的补充。

来自更广泛沟通模拟和基于演员的SBMT的补充证据强调了模拟在培养核心外科技能方面的变革能力。

未来研究应优先扩展基于AI的互动培训,评估多模态沟通动态,并评估与这些教育创新相关的实际患者护理结果。

参考文献

1. McCarrick CA, McEntee PD, Boland PA, et al. A Randomized Controlled Trial of a Deep Language Learning Model-Based Simulation Tool for Undergraduate Medical Students in Surgery. J Surg Educ. 2025 Sep;82(9):103629. doi: 10.1016/j.jsurg.2025.103629. PMID: 40729832.

2. McCarrick CA, Moynihan A, McEntee PD, et al. Impact of simulation training on communication skills and informed consent practices in medical students— a randomized controlled trial. BMC Med Educ. 2025 Jul 18;25(1):1078. doi: 10.1186/s12909-025-07671-0. PMID: 40682099; PMCID: PMC12273346.

3. McCarrick CA, Moynihan A, Khan MF, et al. Impact of Simulation Training on Core Skill Competency of Undergraduate Medical Students. J Surg Educ. 2024 Sep;81(9):1222-1228. doi: 10.1016/j.jsurg.2024.06.006. Epub 2024 Jul 8. PMID: 38981819.

4. Silverman J, Kurtz S, Draper J. Skills for Communicating with Patients. 3rd edition. CRC Press; 2013.

5. Association of American Medical Colleges. Core Entrustable Professional Activities for Entering Residency. 2014.

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注