Nâng cao dự đoán tử vong cuối đời tại khoa cấp cứu nhờ công cụ AI phối hợp

Điểm nổi bật

Nghiên cứu này đánh giá hiệu quả của Geriatric End-of-Life Screening Tool (GEST), một mô hình dựa trên trí tuệ nhân tạo (Artificial Intelligence, AI), so với “câu hỏi bất ngờ” do bác sĩ trả lời (surprise question, SQ) theo phương pháp truyền thống trong dự đoán tử vong trong 6 tháng ở bệnh nhân cao tuổi tại khoa cấp cứu (emergency department, ED). Mô hình phối hợp GEST+SQ cải thiện hiệu chuẩn so với GEST đơn thuần, và quy trình sàng lọc tuần tự giúp giảm đáng kể gánh nặng cho bác sĩ trong khi vẫn duy trì độ chính xác dự đoán.

Bối cảnh nghiên cứu

Khoa cấp cứu thường tiếp nhận người bệnh lớn tuổi với tình trạng sức khỏe phức tạp, trong đó việc nhận diện những bệnh nhân đang ở giai đoạn gần cuối đời là rất quan trọng để kịp thời thảo luận về chăm sóc giảm nhẹ và phân bổ nguồn lực phù hợp. Dự báo tiên lượng theo cách truyền thống thường dựa vào đánh giá trực giác của bác sĩ, chẳng hạn “câu hỏi bất ngờ” (SQ): “Ông/bà có ngạc nhiên nếu bệnh nhân này tử vong trong 6 tháng tới không?”. Mặc dù được sử dụng rộng rãi, SQ vẫn bị hạn chế bởi tính chủ quan và độ chính xác dao động. Các mô hình AI khai thác dữ liệu hồ sơ sức khỏe điện tử mở ra cơ hội cải thiện độ tin cậy của dự đoán và bổ trợ cho đánh giá của bác sĩ trong các bối cảnh chăm sóc cấp tính.

Thiết kế nghiên cứu

Nghiên cứu đoàn hệ tiến cứu này được thực hiện tại một khoa cấp cứu học thuật bậc ba duy nhất từ tháng 11 năm 2022 đến tháng 6 năm 2023. Nghiên cứu tuyển chọn bệnh nhân từ 65 tuổi trở lên đến khám tại ED. Ba phương thức dự đoán tử vong trong 6 tháng được so sánh:

Câu hỏi bất ngờ lâm sàng (SQ), do bác sĩ trả lời tại thời điểm quyết định xử trí ở ED và được ghi nhận trong hồ sơ sức khỏe điện tử
Geriatric End-of-Life Screening Tool (GEST), một mô hình AI tích hợp kết quả xét nghiệm, dấu hiệu sinh tồn, đặc điểm nhân khẩu học và tiền sử bệnh để tính nguy cơ tử vong
Một mô hình hồi quy logistic phối hợp mới (GEST+SQ) tích hợp cả đầu ra của SQ và GEST

Dữ liệu tử vong được thu thập từ hồ sơ điện tử và hồ sơ cấp bang. Nghiên cứu đánh giá độ nhạy, độ đặc hiệu, diện tích dưới đường cong ROC (ROC-AUC) để đánh giá khả năng phân biệt, và sai số hiệu chuẩn kỳ vọng để đánh giá hiệu chuẩn mô hình. Ngoài ra, các tác giả thiết kế một quy trình sàng lọc tuần tự, trong đó bệnh nhân được phân tầng ban đầu bằng GEST thành nhóm nguy cơ thấp và nguy cơ cao sẽ không cần sàng lọc SQ tiếp theo, trong khi chỉ những bệnh nhân nguy cơ trung gian mới được bác sĩ đánh giá bằng SQ.

Kết quả chính

Trong số 9.256 bệnh nhân đủ điều kiện, có 3.479 người hoàn thành trả lời SQ (37,6%), với tỷ lệ tử vong trong 6 tháng là 13,3%. Khi độ nhạy của GEST được ghép với độ nhạy của SQ (83,8%), GEST cho thấy độ đặc hiệu vượt trội (61,5% so với 50,8%). Ngược lại, tại mức độ đặc hiệu tương đương (50,8%), độ nhạy của GEST (90,0%) cao hơn SQ (83,8%). ROC-AUC đạt 0,79 đối với GEST và 0,80 đối với mô hình phối hợp GEST+SQ, cho thấy mức cải thiện khiêm tốn về khả năng phân biệt tổng thể.

Đáng chú ý, mô hình GEST+SQ cải thiện đáng kể các chỉ số hiệu chuẩn (sai số hiệu chuẩn kỳ vọng 0,01 so với 0,042 ở GEST đơn thuần), cho thấy sự phù hợp tốt hơn giữa nguy cơ tử vong dự đoán và nguy cơ tử vong thực tế. Việc triển khai chiến lược sàng lọc tuần tự cho phép bác sĩ chỉ cần tham gia SQ ở 5% bệnh nhân (nhóm nguy cơ trung gian), qua đó có thể giảm 95% gánh nặng đánh giá lâm sàng so với cách tiếp cận chỉ dùng SQ.

Nhìn chung, GEST dựa trên AI vượt trội hơn SQ của bác sĩ trong dự đoán tử vong, và mô hình phối hợp giúp cải thiện hiệu chuẩn nguy cơ mà không làm tăng đáng kể khả năng phân biệt. Mô hình sàng lọc tuần tự kết hợp chấm điểm nguy cơ tự động với đầu vào có chọn lọc từ bác sĩ là một giải pháp thực tiễn và tiết kiệm nguồn lực cho bối cảnh ED.

Nhận định chuyên gia

Nghiên cứu này giải quyết một thách thức quan trọng trong y học cấp cứu: nhận diện người cao tuổi đang ở giai đoạn gần cuối đời trong môi trường làm việc có nhịp độ cao. Việc sử dụng các công cụ AI như GEST khai thác dữ liệu lâm sàng được thu thập thường quy để cung cấp đánh giá nguy cơ khách quan, có thể tái lập. Mặc dù SQ mang lại giá trị về trực giác lâm sàng, phương pháp này vẫn chịu ảnh hưởng bởi cách diễn giải không đồng nhất và việc áp dụng chưa đầy đủ, như thể hiện qua tỷ lệ trả lời chỉ 37,6% trong đoàn hệ nghiên cứu này.

Mức cải thiện khiêm tốn của ROC-AUC khi tích hợp SQ với GEST cho thấy các công cụ AI có thể nắm bắt phần lớn thông tin tiên lượng, nhưng nhận định của bác sĩ vẫn có giá trị trong việc tinh chỉnh hiệu chuẩn nguy cơ. Cách tiếp cận sàng lọc tuần tự là đổi mới và thực tế, có khả năng tối ưu hóa quy trình làm việc bằng cách giảm tải nhận thức cho bác sĩ và tập trung nguồn lực vào những bệnh nhân mà đánh giá lâm sàng mang lại nhiều giá trị nhất.

Hạn chế bao gồm thiết kế đơn trung tâm và dữ liệu trả lời SQ chưa đầy đủ, điều này có thể ảnh hưởng đến tính khái quát. Các nghiên cứu trong tương lai nên xác thực các phát hiện này ở nhiều bối cảnh thực hành khác nhau và đánh giá tác động của các chiến lược sàng lọc như vậy đối với kết cục lâm sàng và tỷ lệ chuyển gửi chăm sóc giảm nhẹ.

Kết luận

Nghiên cứu cho thấy công cụ sàng lọc dựa trên AI là GEST vượt trội hơn một cách khiêm tốn so với “câu hỏi bất ngờ” truyền thống của bác sĩ trong dự đoán tử vong sau 6 tháng ở bệnh nhân cao tuổi tại ED. Mô hình phối hợp giữa GEST và SQ cải thiện hiệu chuẩn nguy cơ và, khi được áp dụng theo quy trình sàng lọc tuần tự, có thể giảm đáng kể công sức của bác sĩ. Các phát hiện này ủng hộ việc tích hợp công cụ sàng lọc AI tự động với đầu vào từ bác sĩ để nâng cao tiên lượng cuối đời và phân bổ nguồn lực trong chăm sóc cấp cứu.

Kinh phí và thử nghiệm lâm sàng

Nguồn tài trợ của nghiên cứu gốc và thông tin đăng ký thử nghiệm lâm sàng không được báo cáo trong tóm tắt. Bạn đọc nên tham khảo toàn văn bài báo đã công bố để biết các khai báo chi tiết.

Tài liệu tham khảo

Haimovich, A.D., Erion-Barner, G., Nathanson, L.A., et al. Improving End-of-Life Screening in the Emergency Department With Collaborative Artificial Intelligence. Ann Emerg Med. 2026 Jun 18. PMID: 42313042.
Downar J, Goldman R, Pinto R, et al. The “Surprise Question” for Predicting Death in Seriously Ill Patients: A Systematic Review and Meta-analysis. CMAJ. 2017;189(13):E484-E493.
Tomasini C, Bursi F, Petrini L, et al. Artificial Intelligence and Machine Learning in Palliative Care: A Narrative Review. J Palliat Med. 2021;24(10):1542-1558.