So sánh giữa ChatGPT-4o và các bác sĩ ung thư phụ khoa trong giao tiếp với bệnh nhân ung thư nội mạc tử cung: Một nghiên cứu so sánh tiền cứu

Nền tảng nghiên cứu và gánh nặng bệnh tật

Ung thư nội mạc tử cung là một trong những bệnh lý ác tính phụ khoa phổ biến nhất trên thế giới, với tỷ lệ mắc ngày càng tăng do dân số già hóa và tỷ lệ béo phì tăng cao. Việc giao tiếp hiệu quả với bệnh nhân về các yếu tố nguy cơ, chiến lược phòng ngừa, thủ tục chẩn đoán và các lựa chọn điều trị là cần thiết để tối ưu hóa kết quả và chất lượng cuộc sống của bệnh nhân. Tuy nhiên, hạn chế về thời gian trong các cuộc gặp lâm sàng và sự khác biệt trong kỹ năng giao tiếp có thể hạn chế việc giáo dục bệnh nhân một cách đầy đủ. Nhu cầu chưa được đáp ứng này tạo ra cơ hội để khám phá các ứng dụng trí tuệ nhân tạo (AI) như ChatGPT-4o để bổ sung cho các tương tác lâm sàng và cải thiện sự hiểu biết và hỗ trợ của bệnh nhân. Bằng cách đánh giá hiệu suất của AI so với các bác sĩ ung thư phụ khoa chuyên khoa trong việc giải đáp câu hỏi của bệnh nhân về ung thư nội mạc tử cung, nghiên cứu này cung cấp những thông tin kịp thời về vai trò của AI trong cảnh quan chăm sóc ung thư đang thay đổi.

Thiết kế nghiên cứu

Nghiên cứu so sánh tiền cứu này sử dụng một tập hợp 100 câu hỏi hướng đến bệnh nhân về ung thư nội mạc tử cung, được chia đều thành hai lĩnh vực: chăm sóc sơ sinh (tập trung vào các yếu tố nguy cơ và phòng ngừa) và chăm sóc thứ cấp (tập trung vào chẩn đoán và điều trị). Các câu hỏi đã được lựa chọn và xem xét cẩn thận bởi các chuyên gia để đảm bảo tính liên quan lâm sàng và phản ánh các mối quan tâm phổ biến của bệnh nhân.

Mỗi câu hỏi được trả lời độc lập bởi ChatGPT-4o và một bác sĩ ung thư phụ khoa có chứng chỉ hành nghề. Sau đó, hai bác sĩ ung thư độc lập đánh giá các câu trả lời về độ chính xác, sự thấu hiểu và tính toàn diện bằng thang đo Likert 4 điểm chuẩn (điểm số cao hơn chỉ ra hiệu suất tốt hơn). Các chỉ số bổ sung bao gồm phân tích số từ và điểm dễ đọc để đánh giá độ dài và khả năng hiểu của câu trả lời. So sánh thống kê được thực hiện để xác định ý nghĩa của các sự khác biệt được quan sát.

Kết quả chính

ChatGPT-4o đã vượt trội đáng kể so với bác sĩ ung thư phụ khoa trong tất cả các lĩnh vực được đánh giá. Cụ thể, điểm số độ chính xác trung bình của ChatGPT-4o là 3.86 so với 3.36 của bác sĩ (p < 0.001), chỉ ra độ chính xác và độ tin cậy thông tin cao hơn.

Về mặt sự thấu hiểu, một lĩnh vực truyền thống khó khăn đối với AI, ChatGPT-4o đạt điểm 3.47, cao hơn đáng kể so với 1.66 của bác sĩ (p < 0.001). Điều này cho thấy các câu trả lời do AI tạo ra nhạy cảm và hướng đến bệnh nhân hơn, có thể tăng cường sự hỗ trợ tình cảm.

Khi đánh giá về tính toàn diện, các câu trả lời của ChatGPT-4o đầy đủ hơn (3.00 so với 1.97; p < 0.001). AI cung cấp các giải thích chi tiết bao quát nhiều khía cạnh của mỗi câu hỏi, trong khi các câu trả lời của bác sĩ thường ngắn gọn nhưng ít chi tiết hơn.

Đáng chú ý, các câu trả lời của ChatGPT-4o có số từ trung bình lớn hơn đáng kể (trung bình 403.51 từ) so với bác sĩ (trung bình 25.06 từ), điều này, mặc dù góp phần vào tính toàn diện, có thể gây quá tải cho một số bệnh nhân. Phân tích độ dễ đọc cho thấy cả văn bản AI và bác sĩ đều yêu cầu mức độ văn hóa tương tự cao, chỉ ra những thách thức đang diễn ra trong việc cung cấp thông tin dễ tiếp cận.

Phân tích phụ so sánh các câu hỏi chăm sóc sơ sinh và chăm sóc thứ cấp cho thấy sự vượt trội nhất quán của ChatGPT-4o, cho thấy hiệu quả của nó trong suốt quá trình chăm sóc.

Bình luận chuyên gia

Những kết quả này thách thức những nhận định trước đây về hạn chế của AI trong giao tiếp lâm sàng, đặc biệt là về sự thấu hiểu. Khả năng của ChatGPT-4o để mô phỏng ngôn ngữ đồng cảm và cung cấp thông tin y tế chi tiết, chính xác mang lại tiềm năng có ý nghĩa cho thực hành ung thư học.

Tuy nhiên, các câu trả lời dài dòng do AI tạo ra có thể được coi là phức tạp hoặc rườm rà quá mức, có thể cản trở sự hiểu của bệnh nhân. Điều này nhấn mạnh nhu cầu về các thuật toán AI tối ưu hóa cân nhắc giữa chi tiết và sự rõ ràng, cũng như các yếu tố văn hóa của bệnh nhân.

Hơn nữa, việc tích hợp các công cụ AI cùng với các bác sĩ con người, đặc biệt là các điều dưỡng ung thư thường xuyên cung cấp giáo dục bệnh nhân và hỗ trợ tâm lý xã hội, có thể cải thiện chất lượng chăm sóc mà không thay thế sự phán đoán quan trọng của con người. Các chuyên gia nhấn mạnh rằng vai trò của AI nên là một công cụ bổ sung để làm giàu giao tiếp, không phải là thay thế mối quan hệ giữa bác sĩ và bệnh nhân.

Hạn chế bao gồm việc so sánh với một bác sĩ ung thư duy nhất và đánh giá các câu trả lời viết tĩnh thay vì đối thoại tương tác. Các nghiên cứu đa trung tâm, có sự tham gia của bệnh nhân trong tương lai đánh giá tính hữu ích và sự chấp nhận trong thực tế là cần thiết.

Kết luận

Nghiên cứu so sánh tiền cứu này chứng minh rằng ChatGPT-4o vượt trội hơn các bác sĩ ung thư phụ khoa về độ chính xác, sự thấu hiểu và tính toàn diện khi giải đáp câu hỏi của bệnh nhân về ung thư nội mạc tử cung. Mặc dù các câu trả lời dài dòng gây ra thách thức, những kết quả này cho thấy vai trò hứa hẹn của AI để bổ sung cho việc chăm sóc và giáo dục bệnh nhân ung thư, cải thiện chăm sóc hỗ trợ.

Để tối đa hóa tính áp dụng lâm sàng, các cải tiến AI trong tương lai phải ưu tiên cân nhắc giữa độ sâu thông tin và độ dễ đọc, cũng như tùy chỉnh giao tiếp phù hợp với nhu cầu cá nhân của từng bệnh nhân. Nghiên cứu tiếp theo nên tập trung vào việc tích hợp các công cụ dựa trên AI trong các khung công tác đa ngành để tối ưu hóa sự tham gia và kết quả của bệnh nhân trong quản lý ung thư nội mạc tử cung.

Tài liệu tham khảo

İnan SA, İnan M, Türkmen O. ChatGPT-4o vs. oncologists in addressing endometrial cancer patient inquiries: A prospective comparative study in primary and secondary care. Eur J Oncol Nurs. 2025 Aug;77:102930. doi: 10.1016/j.ejon.2025.102930. Epub 2025 Jul 17. PMID: 40706414.