Nhấn mạnh
- Các mô hình học máy dự đoán chính xác nguy cơ nhiễm trùng ở trẻ em trong vòng 48 giờ kể từ khi nhập viện tại phòng cấp cứu (ED) bằng cách sử dụng dữ liệu lâm sàng ban đầu.
- Các mô hình kết hợp phương pháp tăng cường cây thang (gradient tree boosting) đạt được AUROCs lên đến 0.94 cho nhiễm trùng và 0.92 hoặc cao hơn cho sốc nhiễm trùng.
- Các đặc trưng dự đoán quan trọng bao gồm chỉ số mức độ nghiêm trọng khẩn cấp, các dấu hiệu sinh tồn điều chỉnh theo tuổi và độ phức tạp y tế được trích xuất từ dữ liệu EHR trong 4 giờ đầu tiên của việc chăm sóc tại ED.
- Phân tích công bằng cho thấy hiệu suất mô hình nhất quán trên các nhóm nhân khẩu học, với độ chính xác cao hơn ở bệnh nhân có bảo hiểm Medicaid so với những người có bảo hiểm thương mại.
Nền tảng nghiên cứu
Nhiễm trùng vẫn là nguyên nhân hàng đầu gây ra bệnh tật và tử vong trong dân số nhi khoa toàn cầu và đặt ra những thách thức lâm sàng đáng kể do tính đa dạng và tiến triển nhanh chóng. Việc nhận diện sớm và điều trị kịp thời cải thiện đáng kể kết quả. Tuy nhiên, việc xác định trẻ em có nguy cơ cao phát triển nhiễm trùng và sốc nhiễm trùng vẫn rất khó khăn, đặc biệt là trong môi trường phòng cấp cứu, nơi các dấu hiệu sớm có thể mờ nhạt và không đặc hiệu. Các tiêu chí chẩn đoán hiện có và phán đoán lâm sàng riêng lẻ có độ nhạy và độ đặc hiệu hạn chế, và các mô hình dự đoán trước đây chưa cải thiện đáng kể việc chẩn đoán sớm. Do đó, có một nhu cầu cấp bách về các công cụ dựa trên dữ liệu mạnh mẽ có thể hỗ trợ các bác sĩ tuyến đầu bằng cách ước tính nguy cơ cá nhân hóa của sự phát triển nhiễm trùng trong giai đoạn đầu của việc đánh giá tại ED.
Thiết kế nghiên cứu
Nghiên cứu quy mô lớn này sử dụng dữ liệu từ năm hệ thống y tế trong mạng lưới Nghiên cứu Chăm sóc Cấp cứu Nhi khoa (PECARN), bao gồm các lượt thăm phòng cấp cứu từ tháng 1 năm 2016 đến tháng 2 năm 2020 cho việc phát triển mô hình và từ tháng 1 năm 2021 đến tháng 12 năm 2022 cho việc xác nhận thời gian. Bệnh nhân đủ tiêu chuẩn là trẻ em từ 2 tháng đến dưới 18 tuổi, loại trừ những người chết hoặc chuyển viện trong quá trình thăm phòng cấp cứu, có chẩn đoán chấn thương, hoặc đã có nhiễm trùng trong khoảng thời gian dữ liệu đặc trưng dự đoán. Sử dụng hồ sơ y tế điện tử (EHRs), thông tin nhân khẩu học và các tham số sinh lý của bệnh nhân được trích xuất từ 4 giờ đầu tiên của việc chăm sóc tại ED. Kết quả chính là sự phát triển nhiễm trùng trong vòng 48 giờ, được định nghĩa bằng nhiễm trùng nghi ngờ cộng với điểm chuẩn Phoenix Sepsis (PSC) ≥2 hoặc tử vong.
Nghiên cứu so sánh các thuật toán học máy—hồi quy logistic với quy chuẩn ridge và tăng cường cây thang (gradient tree boosting)—để dự đoán nhiễm trùng và sốc nhiễm trùng. Báo cáo mô hình tuân thủ các hướng dẫn TRIPOD-AI và phân tích dữ liệu rộng rãi đã được thực hiện đến tháng 7 năm 2025 để đảm bảo sự cẩn thận trong quá trình phát triển và xác nhận.
Kết quả chính
Bộ dữ liệu quy mô lớn bao gồm 1,604,422 lượt thăm đủ tiêu chuẩn trong nhóm huấn luyện và 719,298 trong nhóm kiểm tra. Hiệu suất dự đoán mạnh mẽ, với các mô hình tăng cường cây thang (gradient tree boosting) vượt trội hơn hồi quy logistic.
Đối với việc dự đoán nhiễm trùng, diện tích dưới đường cong đặc trưng hoạt động nhận biết (AUROC) là 0.92 (95% CI, 0.92-0.93) cho hồi quy logistic và 0.94 (95% CI, 0.93-0.94) cho tăng cường cây thang. Các mô hình dự đoán sốc nhiễm trùng thể hiện AUROCs 0.92 hoặc cao hơn, cho thấy khả năng phân biệt tuyệt vời.
Tỷ lệ khả năng dương tính (LR+) cho tăng cường cây thang nằm trong khoảng 4.67 đến 6.18 cho nhiễm trùng và 4.16 đến 5.83 cho sốc nhiễm trùng, cho thấy khả năng tăng đáng kể xác suất sau kiểm tra khi mô hình dự đoán nguy cơ cao.
Các đặc trưng dự đoán quan trọng được xác định bao gồm chỉ số mức độ nghiêm trọng khẩn cấp (triage acuity), các dấu hiệu sinh tồn điều chỉnh theo tuổi như nhịp tim và tần số hô hấp, và độ phức tạp của tiền sử y tế bệnh nhân. Những đầu vào đa chiều này cung cấp một phân loại rủi ro tinh vi hơn các tiêu chí lâm sàng tĩnh.
Nghiên cứu cũng đánh giá sự công bằng của mô hình trên các nhóm nhân khẩu học. AUROCs và tỷ lệ khả năng dương tính nhất quán bất kể chủng tộc, dân tộc hoặc giới tính, nhưng đáng chú ý, các mô hình hoạt động tốt hơn cho bệnh nhân có bảo hiểm Medicaid so với các nhà cung cấp thương mại. Điều này có thể phản ánh sự khác biệt về thu thập dữ liệu hoặc đặc điểm dân số cần được khám phá thêm.
Bình luận chuyên gia
Nghiên cứu kỹ lưỡng này chứng minh tiềm năng của các phương pháp học máy để biến đổi dự đoán nhiễm trùng nhi khoa trong các môi trường cấp cứu bằng cách tận dụng dữ liệu EHR quy mô lớn từ nhiều địa điểm. AUROCs và tỷ lệ khả năng dương tính cao xác nhận rằng việc kết hợp thông tin lâm sàng được thu thập thường xuyên với phân tích nâng cao có thể tạo ra các cảnh báo sớm chính xác.
Ưu điểm bao gồm dân số bệnh nhân đa dạng về mặt địa lý, xác nhận bên ngoài vững chắc theo thời gian và tuân thủ các tiêu chuẩn báo cáo minh bạch. Việc sử dụng các biến dễ dàng thu thập thúc đẩy việc triển khai thực tế.
Tuy nhiên, vẫn còn những thách thức. Nghiên cứu đã loại trừ một số dân số có nguy cơ cao, chẳng hạn như những người bị chấn thương hoặc đã có nhiễm trùng trước đó, điều này hạn chế khả năng áp dụng cho các nhóm con này. Các thiên lệ liên quan đến tình trạng bảo hiểm cần được phân tích thêm để tránh sự bất bình đẳng không mong muốn trong việc triển khai hỗ trợ quyết định lâm sàng. Ngoài ra, tích hợp với quy trình làm việc lâm sàng và đánh giá tác động triển vọng đối với kết quả điều trị là các bước quan trọng trong tương lai.
Về mặt sinh học, các đặc trưng dự đoán phù hợp với bệnh lý nhiễm trùng đã biết, trong đó các dấu hiệu sinh tồn thay đổi phản ánh các phản ứng viêm hệ thống sớm, và độ phức tạp y tế cao có thể làm tăng nguy cơ biến chứng nhiễm trùng.
Kết luận
Nghiên cứu này cung cấp bằng chứng thuyết phục rằng các mô hình học máy dựa trên dữ liệu lâm sàng sớm tại ED có thể dự đoán một cách đáng tin cậy nhiễm trùng và sốc nhiễm trùng ở trẻ em trong vòng 48 giờ. Phương pháp tăng cường cây thang (gradient tree boosting), với hiệu suất phân biệt tuyệt vời và tỷ lệ khả năng dương tính, cung cấp một công cụ hứa hẹn để tăng cường phán đoán của bác sĩ và có thể cho phép can thiệp sớm hơn.
Nghiên cứu trong tương lai nên nhấn mạnh xác nhận triển vọng, tích hợp vào các hệ thống hỗ trợ quyết định lâm sàng và đánh giá tác động đối với độ kịp thời của điều trị và kết quả. Đối phó với sự bất bình đẳng liên quan đến bảo hiểm và các yếu tố xã hội khác cũng là quan trọng để chăm sóc công bằng. Khi nhiễm trùng nhi khoa vẫn là một thách thức sức khỏe cộng đồng lớn, các mô hình dự đoán dựa trên dữ liệu như vậy có tiềm năng cải thiện đáng kể việc nhận diện sớm và giảm bệnh tật và tử vong trong dân số dễ tổn thương này.
Tài trợ và ClinicalTrials.gov
Nghiên cứu này được thực hiện dưới sự bảo trợ của Mạng lưới Nghiên cứu Chăm sóc Cấp cứu Nhi khoa (PECARN). Các nguồn tài trợ cụ thể không được báo cáo trong dữ liệu có sẵn. Nghiên cứu này sử dụng dữ liệu đăng ký hồi cứu; không có đăng ký thử nghiệm lâm sàng được chỉ định.
Tài liệu tham khảo
Alpern ER, Scott HF, Balamuth F, Chamberlain JM, Depinet H, Bajaj L, Simon NE, Carter CP, Elsholz C, Webb M, Campos D, Deakyne Davies SJ, Cook LJ, Ungar L, Grundmeier R; PECARN PED Screen Study Group. Derivation and Validation of Predictive Models for Early Pediatric Sepsis. JAMA Pediatr. 2025 Oct 13:e253892. doi: 10.1001/jamapediatrics.2025.3892. Epub ahead of print. PMID: 41082207; PMCID: PMC12519407.