Nâng cao kỹ năng lấy bệnh sử phẫu thuật cho sinh viên y khoa bằng cách sử dụng bệnh nhân mô phỏng được hỗ trợ bởi AI: Một thử nghiệm lâm sàng ngẫu nhiên

Nâng cao kỹ năng lấy bệnh sử phẫu thuật cho sinh viên y khoa bằng cách sử dụng bệnh nhân mô phỏng được hỗ trợ bởi AI: Một thử nghiệm lâm sàng ngẫu nhiên

Giới thiệu

Giao tiếp hiệu quả là một kỹ năng không thể thiếu trong thực hành phẫu thuật, bắt đầu từ khả năng lấy một bệnh sử toàn diện và chính xác. Sự thành thạo trong việc lấy bệnh sử giúp các bác sĩ phẫu thuật thu thập thông tin lâm sàng thiết yếu, xây dựng mối quan hệ tốt với bệnh nhân và điều chỉnh các biện pháp chẩn đoán và điều trị tiếp theo. Theo truyền thống, chương trình giảng dạy y khoa tích hợp các phương pháp đào tạo dựa trên mô phỏng để nâng cao các kỹ năng giao tiếp lâm sàng và giao tiếp cá nhân, sử dụng bệnh nhân tiêu chuẩn hoặc mô phỏng (SPs) để cung cấp môi trường học tập tương tác, trải nghiệm. Tuy nhiên, khả năng và tiêu chuẩn hóa của các bệnh nhân SP người thật có thể bị hạn chế bởi các ràng buộc về hậu cần, tài chính và lịch trình.

Các tiến bộ gần đây trong trí tuệ nhân tạo (AI), đặc biệt là các mô hình học ngôn ngữ sâu (DLM) như ChatGPT do OpenAI phát triển, mang lại cơ hội đổi mới để tăng cường giáo dục y khoa. Các mô hình này có khả năng tạo ra các cuộc tương tác mô phỏng bệnh nhân chi tiết, phù hợp về mặt ngữ cảnh và tinh tế trong thời gian thực, có thể giải quyết các hạn chế của các phương pháp mô phỏng truyền thống.

Bài viết này phân tích một thử nghiệm lâm sàng ngẫu nhiên vừa được công bố, đánh giá việc tích hợp công cụ mô phỏng dựa trên DLM như một bệnh nhân mô phỏng ảo để nâng cao kỹ năng lấy bệnh sử phẫu thuật cho sinh viên y khoa đại học năm cuối trong quá trình thực tập lâm sàng. Bài viết cũng thảo luận về ý nghĩa của nghiên cứu đối với giáo dục lâm sàng và các ứng dụng AI trong tương lai.

Nền tảng nghiên cứu và nhu cầu giáo dục

Giao tiếp phẫu thuật hiệu quả bắt đầu từ việc lấy bệnh sử có cấu trúc, hướng đến bệnh nhân và liên quan về mặt lâm sàng. Mặc dù rất quan trọng, nhưng sinh viên y khoa thường báo cáo rằng họ cảm thấy thiếu tự tin và sự tiếp xúc không đồng đều với các tình huống lâm sàng đa dạng trong quá trình thực tập phẫu thuật. Đào tạo mô phỏng đã được sử dụng để bắc cầu khoảng cách này, nhưng sự phụ thuộc vào các bệnh nhân SP người thật vẫn tiêu tốn nhiều nguồn lực.

Các mô hình học ngôn ngữ sâu đại diện cho một lĩnh vực mới trong công nghệ giáo dục, thể hiện khả năng duy trì các cuộc đối thoại nhất quán và thực tế, và mô phỏng các phản ứng giống như con người. Việc sử dụng các bệnh nhân SP được hỗ trợ bởi AI có thể cung cấp các trải nghiệm mô phỏng có thể mở rộng, dễ tiếp cận và nhất quán. Tuy nhiên, bằng chứng mạnh mẽ từ các thử nghiệm lâm sàng ngẫu nhiên đánh giá hiệu quả giáo dục của chúng trong các bối cảnh đào tạo phẫu thuật là hạn chế.

Thiết kế và phương pháp nghiên cứu

McCarrick và cộng sự đã tiến hành một thử nghiệm lâm sàng ngẫu nhiên với 90 sinh viên y khoa năm cuối đăng ký học một mô đun phẫu thuật. Người tham gia được phân bổ thông qua mẫu ngẫu nhiên theo cụm thành hai nhóm bằng nhau: một nhóm đối chứng nhận được học tập trải nghiệm chuẩn trong quá trình thực tập lâm sàng, và một nhóm can thiệp nhận thêm đào tạo bao gồm ba buổi học có cấu trúc tương tác với DLM (cụ thể là ChatGPT của OpenAI) đóng vai trò là bệnh nhân mô phỏng.

Các cuộc tương tác dựa trên DLM được kịch bản hóa thông qua các yêu cầu của sinh viên, và các bản ghi cuộc trò chuyện sau đó được nộp cho giáo viên đánh giá để đảm bảo tính phù hợp lâm sàng và giá trị giáo dục. Tất cả sinh viên đều tham gia các kỳ thi lâm sàng có cấu trúc mục tiêu (OSCEs) chuẩn bao gồm việc lấy bệnh sử từ một bệnh nhân SP người thật. Các giám khảo được che giấu thông tin về nhóm sinh viên để giảm thiểu sự thiên vị. Các kỳ thi OSCEs chuẩn được tiến hành để xác định năng lực ban đầu, sau đó là một đợt đánh giá lặp lại sau khi kết thúc thời gian can thiệp hoặc thời gian học truyền thống tương đương.

Ngoài ra, sinh viên trong nhóm can thiệp đã hoàn thành một khảo sát ẩn danh để thu thập các chỉ số chủ quan bao gồm sự tự tin trong giao tiếp, mức độ thực tế và chi tiết của các bệnh sử do DLM tạo ra, và mong muốn sử dụng công cụ này trong các đợt đào tạo tương lai.

Kết quả chính

Sau khi thử nghiệm thử nghiệm thành công, cuộc thử nghiệm chính thức đã thu hút 90 người tham gia được chia đều giữa các nhóm. Điểm OSCEs ban đầu phản ánh năng lực lấy bệnh sử giữa các nhóm có sự khác biệt thống kê (giá trị p không được chỉ định).

Kết quả sau khi can thiệp cho thấy sự cải thiện đáng kể trong điểm OSCEs chỉ trong nhóm can thiệp (p < 0.001). Kích thước hiệu ứng được đo bằng Cohen's d là 0.37 trong nhóm can thiệp so với 0.19 trong nhóm đối chứng, cho thấy lợi ích giáo dục đáng kể có thể quy cho các buổi học mô phỏng dựa trên DLM.

Chất lượng nội dung từ DLM được đánh giá là phù hợp và liên quan về mặt lâm sàng một cách đồng đều bởi các giáo viên, khẳng định khả năng của mô hình trong việc tạo ra các tình huống bệnh nhân phù hợp về mặt ngữ cảnh.

Tỷ lệ tham gia khảo sát là 62% trong số sinh viên can thiệp. Trong số những người trả lời, 57% tự báo cáo tăng sự tự tin trong kỹ năng giao tiếp, 72% đánh giá các bệnh sử do DLM tạo ra là phong phú và chi tiết, và 95% bày tỏ mong muốn tương tác với công cụ mô phỏng dựa trên DLM trong các đợt đào tạo tương lai.

Không có tác động bất lợi hoặc tác động tiêu cực đến việc học được xác định. Dữ liệu tổng thể ủng hộ các kết quả giáo dục được cải thiện có thể quy cho việc mô phỏng được hỗ trợ bởi DLM.

Bình luận chuyên gia và xem xét

Nghiên cứu tiên phong này cung cấp bằng chứng nghiêm ngặt hỗ trợ việc tích hợp các mô hình ngôn ngữ AI tiên tiến vào giáo dục phẫu thuật, đánh dấu một sự thay đổi tiềm năng trong đào tạo mô phỏng.

Thiết kế ngẫu nhiên, việc sử dụng các giám khảo được che giấu thông tin và các biện pháp năng lực khách quan tăng cường tính hợp lệ của kết quả. Kích thước hiệu ứng trung bình minh họa sự cải thiện có thể cảm nhận được trong việc thu được kỹ năng, điều này có ý nghĩa giáo dục khi xem xét các lợi ích về hiệu suất của các công cụ được hỗ trợ bởi AI.

Tuy nhiên, một số hạn chế cần lưu ý. Nghiên cứu bị giới hạn ở một tổ chức và một nhóm cụ thể, có thể ảnh hưởng đến tính phổ biến. Sự duy trì lâu dài của kỹ năng sau khi can thiệp không được đánh giá, cũng như hiệu quả của công cụ trong các tình huống phẫu thuật phức tạp hơn hoặc đa dạng hơn.

Nghiên cứu tiếp theo nên khám phá các kết quả dài hạn, tích hợp với các phương thức giáo dục khác và khả năng mở rộng qua các tổ chức. Ngoài ra, các xem xét đạo đức liên quan đến việc sử dụng AI trong giáo dục, bao gồm quyền riêng tư dữ liệu, sự phụ thuộc của sinh viên vào AI và các thiên lệch tiềm ẩn trong đầu ra của mô hình, phải được giải quyết một cách nghiêm túc.

Dù có những xem xét này, nghiên cứu này phù hợp với một cơ thể văn献 đang逐渐形成,提倡有条不紊地将AI纳入以补充而非替代人类临床教学。

结论

在一项针对高年级医学生的随机对照试验中,采用深度语言学习模型作为模拟患者显著提高了外科病史采集能力和学生自信心。随着AI技术的发展,这些工具通过提供标准化、可访问且引人入胜的模拟体验,具有增强外科教育的潜力。

这一创新解决了传统模拟项目中固有的体验式学习和资源限制的关键问题。未来的工作应旨在在更广泛的环境中验证这些发现,并制定指南以优化AI整合,同时确保教育质量和道德标准。

参考文献

McCarrick CA, McEntee PD, Boland PA, Donnelly S, O’Meara Y, Heneghan H, Cahill RA. 用于外科医学生的一种基于深度语言学习模型的模拟工具的随机对照试验。J Surg Educ. 2025年9月;82(9):103629。doi: 10.1016/j.jsurg.2025.103629。Epub 2025年7月28日。PMID: 40729832。

Kneebone R. 模拟在外科培训中的应用:教育问题和实际影响。Med Educ. 2003年;37(3):267-77。

Topol EJ. 高性能医学:人类与人工智能的融合。Nat Med. 2019年1月;25(1):44-56。

Muller AM等。用于医学教育的人工智能虚拟患者:一项范围综述。BMC Med Educ. 2023年;23(1):123。

Comments

No comments yet. Why don’t you start the discussion?

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *