Nhấn mạnh
– Một nhóm đối tượng hồi cứu quốc tế (đăng ký SENIOR) đã sử dụng mạng lưới thần kinh nhân tạo (ANNs) để dự đoán sự sống sót tổng thể (OS) và sự sống sót không tiến triển (PFS) ở bệnh nhân ≥65 tuổi mắc bệnh HNSCC tiến triển cục bộ được điều trị bằng hóa xạ trị quyết định.
– Các mô hình đạt được sự phân biệt vừa phải (OS ROC-AUC 0,68, PFS ROC-AUC 0,64) và xác định trạng thái virus u nhú người (HPV), tốc độ lọc cầu thận ước tính (eGFR), trạng thái hoạt động của Nhóm Hợp tác Ung thư Đông (ECOG) và phân loại hạch là những đặc điểm có ảnh hưởng lớn nhất.
Nền tảng
Ung thư tế bào vảy đầu cổ (HNSCC) là một bệnh chủ yếu ảnh hưởng đến người cao tuổi. Dân số này có sự khác biệt về bệnh kèm theo, dự trữ chức năng và khả năng chịu đựng điều trị, nhưng bệnh nhân cao tuổi ít được đại diện trong các thử nghiệm ngẫu nhiên. Do đó, các bác sĩ thường phải cá nhân hóa quyết định hóa xạ trị quyết định mà không có bằng chứng cụ thể về độ tuổi mạnh mẽ.
Các mô hình dự đoán tích hợp các biến lâm sàng thông thường có thể hỗ trợ quyết định chia sẻ, điều chỉnh cường độ và phân bổ nguồn lực hỗ trợ. Học máy (ML), bao gồm mạng lưới thần kinh nhân tạo (ANNs), hứa hẹn phát hiện các mối quan hệ phi tuyến tính và tương tác mà hồi quy thông thường có thể bỏ sót. Tuy nhiên, hiệu suất mô hình, khả năng giải thích, xác minh bên ngoài và tính hữu ích lâm sàng vẫn là những rào cản quan trọng trước khi triển khai trong thực hành.
Thiết kế nghiên cứu
Marschner et al. báo cáo một nghiên cứu nhóm đối tượng hồi cứu quốc tế (đăng ký SENIOR) đã phát triển và xác minh bên ngoài hai mô hình ANN để dự đoán OS và PFS ở người cao tuổi (≥65 tuổi) mắc bệnh HNSCC tiến triển cục bộ được điều trị bằng xạ trị quyết định và liệu pháp toàn thân đồng thời từ năm 2005 đến 2019.
Điều kiện bao gồm chính: ≥65 tuổi, HNSCC tiến triển cục bộ, hóa xạ trị quyết định. Các trường hợp loại trừ bao gồm hóa trị cảm ứng hoặc phụ trợ, tiền sử ung thư đầu cổ, hoặc bệnh di căn tại thời điểm bắt đầu điều trị. Dữ liệu được tổng hợp từ 19 trung tâm học thuật trên khắp Đức, Thụy Sĩ, Cộng hòa Séc, Síp và Hoa Kỳ. Thời gian thu thập các trường hợp là 2005–2019; việc quản lý dữ liệu diễn ra từ 2021–2023. Phân tích được thực hiện từ tháng 12 năm 2023 đến tháng 4 năm 2025.
Chia tách đào tạo và kiểm tra: đối với OS, 738 bệnh nhân trong tập huấn luyện và 160 trong tập kiểm tra (tổng số n=898). Đối với PFS, 770 trong tập huấn luyện và 175 trong tập kiểm tra (tổng số n=945). Các mô hình được đánh giá bằng diện tích dưới đường cong ROC (AUC) và AUC độ chính xác-độ thu hồi; tầm quan trọng của đặc điểm và khả năng giải thích được đánh giá bằng giá trị giải thích cộng gộp Shapley (SHAP). Bệnh nhân được phân loại thành nhóm có nguy cơ cao hoặc thấp dựa trên ngưỡng đầu ra mô hình trung bình.
Kết quả chính
Tính chất dân số: tuổi trung vị 71 năm (IQR 68–76); khoảng ba phần tư là nam giới (74%). Nhóm bao gồm bệnh nhân được điều trị bằng xạ trị quyết định cùng với liệu pháp toàn thân; trạng thái HPV được bao gồm khi có sẵn.
Hiệu suất mô hình
– Mô hình ANN dự đoán sự sống sót tổng thể: ROC-AUC 0,68 (95% CI, 0,60–0,76) trong tập kiểm tra bên ngoài. Mô hình phân loại bệnh nhân thành các nhóm có nguy cơ cao và thấp với sự khác biệt về sự sống sót có ý nghĩa thống kê.
– Mô hình ANN dự đoán sự sống sót không tiến triển: ROC-AUC 0,64 (95% CI, 0,56–0,72) trong tập kiểm tra.
– AUC độ chính xác-độ thu hồi được báo cáo để giải quyết sự mất cân đối lớp; các giá trị số không được nhấn mạnh trong bản tóm tắt nhưng được sử dụng để bổ sung các chỉ số phân biệt.
Đặc điểm dự đoán hàng đầu
Phân tích SHAP xác định các yếu tố dự đoán có ảnh hưởng lớn nhất trong các mô hình: trạng thái virus u nhú người (HPV) (có sức dự đoán mạnh trong bệnh ung thư vòm họng), chức năng thận được đo bằng eGFR, trạng thái hoạt động của ECOG và phân loại hạch (giai đoạn N). Các đặc điểm này phù hợp với kiến thức lâm sàng: ung thư vòm họng HPV dương tính có tiên lượng tốt hơn, tình trạng chức năng và chức năng cơ quan cơ bản ảnh hưởng đến khả năng chịu đựng điều trị và tử vong cạnh tranh, và gánh nặng hạch liên quan đến nguy cơ tái phát.
Phân loại rủi ro và ứng dụng lâm sàng tiềm năng
Sử dụng ngưỡng phân loại nhị phân dựa trên đầu ra mô hình trung bình, các ANNs chia bệnh nhân thành các nhóm có đường đi sự sống sót khác nhau. Các tác giả đề xuất rằng các mô hình này có thể hỗ trợ cá nhân hóa điều trị — ví dụ, xác định bệnh nhân có nguy cơ tử vong cạnh tranh cao nơi giảm cường độ điều trị hoặc tăng cường chăm sóc hỗ trợ có thể phù hợp, hoặc xác định người cao tuổi có nguy cơ thấp có thể chịu đựng hóa xạ trị chuẩn.
Bình luận chuyên gia: diễn giải, ưu điểm và hạn chế
Nghiên cứu giải quyết một khoảng cách lâm sàng có ý nghĩa bằng cách tập trung vào người cao tuổi mắc bệnh HNSCC và sử dụng dữ liệu từ nhiều địa điểm để phát triển và kiểm tra bên ngoài. Một số khía cạnh làm tăng giá trị đóng góp của nó:
- Dữ liệu quốc tế, đa trung tâm tăng tính đa dạng và nâng cao khả năng tổng quát hóa so với các mô hình đơn trung tâm.
- Các tập kiểm tra bên ngoài được sử dụng thay vì chỉ kiểm tra chéo nội bộ, là bước quan trọng hướng tới đánh giá hiệu suất không thiên vị.
- Khả năng giải thích mô hình thông qua SHAP cung cấp các đóng góp đặc điểm có thể giải thích, giúp các bác sĩ dễ dàng đánh giá hành vi của mô hình.
Tuy nhiên, các hạn chế chính làm giảm sự nhiệt tình cho việc triển khai lâm sàng ngay lập tức:
- Phân biệt vừa phải: ROC-AUCs 0,68 (OS) và 0,64 (PFS) chỉ ra khả năng tách biệt kết quả ở mức cá nhân chỉ ở mức vừa phải. Để đưa ra quyết định lâm sàng, đặc biệt là khi các quyết định mang lại tổn thương đáng kể, thường yêu cầu sự phân biệt cao hơn và lợi ích ròng được chứng minh.
- Kiểm định và tính hữu ích lâm sàng: Bản tóm tắt báo cáo các chỉ số phân biệt nhưng không trình bày các biểu đồ kiểm định hoặc phân tích đường cong quyết định. Mô hình có khả năng phân biệt chấp nhận được vẫn có thể ước lượng sai rủi ro tuyệt đối, tạo ra các khuyến nghị lâm sàng không tối ưu.
- Thiết kế hồi cứu và khả năng thiên lệch thông tin: Dữ liệu từ 2005–2019 bao gồm các thay đổi theo thời gian về phân loại, thực hành xét nghiệm HPV, kỹ thuật xạ trị (sử dụng IMRT), và liệu pháp toàn thân (ví dụ, cetuximab so với platium, liệu pháp miễn dịch đang phát triển). Sự đa dạng trong các phác đồ điều trị và việc không thu thập đầy đủ các biến phức tạp (cường độ liều, gián đoạn, yếu tố xác định xã hội) có thể ảnh hưởng đến hiệu suất mô hình và khả năng vận chuyển.
- Thiếu các biện pháp cụ thể cho người cao tuổi: Các yếu tố quyết định kết quả quan trọng ở người cao tuổi—đánh giá toàn diện về geriatric như nhận thức, di chuyển, dinh dưỡng, hỗ trợ xã hội và dùng thuốc nhiều—không được nhấn mạnh. Các công cụ geriatric oncology hiện tại (điểm độc hại CARG, Đánh giá Geriatric) cung cấp thông tin vượt quá trạng thái hoạt động và các giá trị phòng thí nghiệm và có thể cải thiện dự đoán cá nhân (Hurria et al., 2011; Mohile et al., 2018).
- Rủi ro cạnh tranh và kết quả cụ thể theo nguyên nhân: Người cao tuổi có rủi ro cạnh tranh đáng kể từ các nguyên nhân không phải ung thư. Các mô hình dự đoán OS có thể cần các phương pháp rủi ro cạnh tranh để phân biệt tử vong do ung thư từ các nguyên nhân khác, điều này có ảnh hưởng trực tiếp đến các quyết định điều trị tập trung vào kiểm soát bệnh hoặc tuổi thọ.
- Tác động đến quyết định và kết quả chưa rõ: Câu hỏi trung tâm là liệu các quyết định dựa trên ANN có thay đổi quản lý và cải thiện các kết quả hướng đến bệnh nhân (sự sống sót, chất lượng cuộc sống, độc tính điều trị) hay không. Các nghiên cứu đánh giá tác động triển vọng hoặc các thử nghiệm lâm sàng ngẫu nhiên là cần thiết để chứng minh lợi ích lâm sàng và phát hiện các tác hại không mong muốn.
Cách các mô hình này phù hợp với thực hành hiện tại
Các công cụ dự đoán cho người cao tuổi nên bổ sung—không thay thế—đánh giá lâm sàng toàn diện. Các hướng dẫn geriatric oncology hiện tại khuyến nghị tích hợp đánh giá geriatric để xác định các yếu điểm và hướng dẫn quản lý (ví dụ, hướng dẫn ASCO). Mô hình ANN được huấn luyện trên các biến lâm sàng thông thường có thể là công cụ sàng lọc đầu tiên dễ tiếp cận để phát hiện bệnh nhân cần đánh giá geriatric đầy đủ, tham gia thử nghiệm hoặc chuyển giới thiệu chăm sóc giảm nhẹ sớm.
Các bác sĩ và cơ sở y tế xem xét việc tích hợp nên yêu cầu minh bạch về đầu vào mô hình, tiền xử lý, xử lý dữ liệu thiếu, kiểm định trên dân số địa phương và giao diện hướng đến người dùng giải thích sự không chắc chắn. Việc tích hợp quy trình làm việc cũng phải tôn trọng giá trị của bệnh nhân và đảm bảo quyết định chia sẻ, đặc biệt là khi các mô hình đề xuất giảm cường độ.
Các bước tiếp theo và ưu tiên nghiên cứu
Để đưa các ANNs này vào thực hành, các bước sau được khuyến nghị:
- Xác minh triển vọng trong các bối cảnh lâm sàng đa dạng với các phác đồ điều trị cập nhật và các biến geriatric đầy đủ.
- Đánh giá kiểm định và, nếu cần, hiệu chỉnh địa phương để duy trì ước lượng rủi ro tuyệt đối chính xác.
- Phân tích đường cong quyết định và các nghiên cứu đánh giá tác động lâm sàng để đánh giá lợi ích ròng và các kết quả hướng đến bệnh nhân.
- Tích hợp với các công cụ đánh giá geriatric và các dấu ấn sinh học (ví dụ, các dấu ấn viêm, chỉ số suy yếu) để cải thiện sự phân biệt và tính liên quan lâm sàng.
- Nghiên cứu đạo đức và triển khai giải quyết minh bạch, sự chấp nhận của bác sĩ và tránh thiên lệch thuật toán (ví dụ, hiệu suất khác biệt giữa các nhóm nhân khẩu).
Kết luận
Marschner và các đồng nghiệp đã phát triển và kiểm tra bên ngoài các ANNs có khả năng phân biệt vừa phải OS và PFS ở người cao tuổi nhận hóa xạ trị quyết định cho HNSCC tiến triển cục bộ. Các yếu tố dự đoán quan trọng được xác định (HPV, eGFR, ECOG, giai đoạn hạch) xác nhận trực giác lâm sàng và hỗ trợ tính hợp lý bề ngoài của mô hình. Tuy nhiên, AUCs vừa phải, thiếu các chỉ số kiểm định và đường cong quyết định được báo cáo, thiết kế hồi cứu và mức độ chi tiết geriatric hạn chế có nghĩa là các mô hình này chỉ là giả thuyết tạo ra chứ chưa sẵn sàng cho triển khai lâm sàng thường xuyên.
Xác minh triển vọng tốt, tích hợp với đánh giá geriatric và đánh giá tác động là cần thiết trước khi ANNs có thể được khuyến nghị làm công cụ hỗ trợ quyết định trong dân số dễ bị tổn thương này. Trong khi chờ đợi, các mô hình này cung cấp một khung hứa hẹn để làm sắc nét phân loại rủi ro và ưu tiên bệnh nhân cho đánh giá geriatric toàn diện và kế hoạch điều trị cá nhân hóa.
Tài trợ và clinicaltrials.gov
Tài trợ: Không được báo cáo trong bản tóm tắt được cung cấp. Xem bài báo gốc trên JAMA Otolaryngology—Head & Neck Surgery để biết các thông tin tài trợ đầy đủ.
ClinicalTrials.gov: Không áp dụng; nghiên cứu đăng ký hồi cứu.
Tham khảo
1. Marschner SN, Lombardo E, Haehl E, et al.Outcome Prediction in Older Adults With Head and Neck Cancer Undergoing Chemoradiation. JAMA Otolaryngol Head Neck Surg. 2025 Nov 6:e253840. doi:10.1001/jamaoto.2025.3840.
2. Hurria A, Togawa K, Mohile SG, et al. Predicting Chemotherapy Toxicity in Older Adults With Cancer: A Prospective Multicenter Study. J Clin Oncol. 2011;29(25):3457–3465.
3. Mohile SG, Cesari M, Hurria A, et al. Practical Assessment and Management of Vulnerabilities in Older Patients Receiving Chemotherapy: ASCO Guideline. J Clin Oncol. 2018;36(22):2326–2347.
4. Collins GS, Reitsma JB, Altman DG, Moons KG. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): The TRIPOD Statement. Ann Intern Med. 2015;162(1):55–63.
5. Lundberg SM, Lee SI. A unified approach to interpreting model predictions. arXiv:1705.07874. 2017.
6. Pignon JP, le Maître A, Maillard E, Bourhis J; MACH-NC Collaborative Group. Meta-analysis of chemotherapy in head and neck cancer (MACH-NC): an update on 93 randomized trials and 17,346 patients. Lancet Oncol. 2009;10(11):888–892.
7. Steyerberg EW. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating. 2nd ed. Springer; 2019.
8. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019;25(1):44–56.
Hình ảnh thumbnail (sinh ảnh AI)
Hình ảnh siêu thực: một người cao tuổi (đầu 70) ngồi với bác sĩ ung thư trong một phòng tư vấn sáng sủa; màn hình máy tính bảng hiển thị đường cong xác suất sống sót màu và biểu đồ cột kiểu SHAP; mặt nạ xạ trị và lát cắt CT đầu cổ hiển thị ở phía sau; bố cục yên tĩnh, chuyên nghiệp, bao gồm; độ phân giải cao, ánh sáng tự nhiên.

