Những điểm nổi bật
- Các mô hình bệnh lý trí tuệ nhân tạo mã nguồn mở cho thấy khả năng dự đoán đột biến EGFR trực tiếp từ các slide H&E với AUC lên tới 0.83, có tiềm năng tăng tốc quyết định lâm sàng.
- Có sự khác biệt hiệu suất đáng kể giữa các nhóm dòng dõi, với các mô hình hoạt động kém hơn nhiều ở bệnh nhân có dòng dõi Á (AUC 0.68) so với những người có dòng dõi Âu (AUC 0.84) hoặc Phi (AUC 0.85).
- Môi trường mô vẫn là một biến số quan trọng, vì hiệu suất AI giảm đáng kể ở các mẫu màng phổi so với các mẫu mô phổi chính.
- Phân loại được hướng dẫn bởi AI có thể giảm nhu cầu kiểm tra phân tử nhanh chóng lên tới 57%, tối ưu hóa việc phân bổ tài nguyên trong y học ung thư chính xác.
Nền tảng
Việc quản lý ung thư phế quản tuyến (LUAD) đã được cách mạng hóa nhờ việc xác định các yếu tố gây ung thư có thể nhắm mục tiêu, nổi bật nhất là các đột biến trong thụ thể yếu tố tăng trưởng biểu bì (EGFR). Việc xác định các đột biến này là cần thiết để bắt đầu liệu pháp ức chế kinase tyrosine (TKI), cải thiện đáng kể kết quả sống sót so với hóa trị truyền thống. Tuy nhiên, các phương pháp kiểm tra phân tử thông thường như sequensing thế hệ mới (NGS) và phản ứng chuỗi polymerase (PCR) thường mất thời gian (1–3 tuần) và yêu cầu lượng mô đáng kể, điều này có thể làm chậm việc bắt đầu liệu pháp cứu sống.
Trí tuệ nhân tạo (AI), cụ thể là các mô hình học sâu được đào tạo trên các hình ảnh toàn bộ slide (WSIs) của các slide nhuộm hematoxylin-eosin (H&E), đã xuất hiện như một giải pháp đột phá. Các mô hình này nhằm mục đích xác định các mẫu hình thái học—thường không thể nhận biết bằng mắt thường—liên quan đến các thay đổi gen cụ thể. Mặc dù các nghiên cứu chứng minh khái niệm ban đầu đã chứng minh khả thi của dự đoán “hình ảnh thành đột biến”, vẫn còn một nhu cầu chưa đáp ứng: đảm bảo các mô hình này mạnh mẽ, tổng quát và công bằng trên các dân số đa dạng toàn cầu và các loại mẫu lâm sàng khác nhau.
Nội dung Chính
Sự phát triển theo thời gian của AI trong Bệnh lý Ung thư Phổi
Hành trình dự đoán đột biến dựa trên AI bắt đầu với các nghiên cứu nền tảng (ví dụ, Coudray et al., 2018) chứng minh rằng các mạng lưới neuron tích chập (CNNs) có thể phân biệt giữa LUAD và ung thư biểu mô tế bào vảy và dự đoán các đột biến phổ biến như EGFR và KRAS với độ chính xác trung bình. Sau đó, nhiều mô hình “hộp đen” và có thể giải thích đã được phát triển. Gần đây, tập trung đã chuyển từ xác thực nội bộ trong các tổ chức đơn lẻ sang xác thực ngoại vi quy mô lớn, đa tổ chức. Nghiên cứu của Rakaee et al. (2026) đại diện cho một cột mốc quan trọng trong tiến trình này, vượt qua các chỉ số độ chính xác đơn giản để điều tra các yếu tố xã hội-sinh học ảnh hưởng đến hiệu suất mô hình, cụ thể là dòng dõi di truyền.
Bằng chứng theo Kiến trúc Mô hình và Hiệu suất
Căn cứ bằng chứng hiện tại liên quan đến hai mô hình bệnh lý AI mã nguồn mở chính. Trong nhóm Dana-Farber Cancer Institute (DFCI) (n = 1759), một mô hình đã thể hiện khả năng dự đoán trạng thái EGFR tốt hơn với AUC 0.83 (95% CI, 0.81-0.85), trong khi mô hình thứ hai kém xa với AUC 0.68. Sự khác biệt này nhấn mạnh tác động của kiến trúc đào tạo và sự đa dạng của dữ liệu đào tạo đối với độ mạnh mẽ của mô hình. Trong nhóm xác thực TNM-I châu Âu (n = 339), các mô hình duy trì hiệu suất tương đối ổn định (AUC 0.81 và 0.75, tương ứng), cho thấy mức độ tổng quát hóa địa lý giữa các dân số phương Tây.
Sự khác biệt Hiệu suất theo Dòng dõi Di truyền
Thật sự đáng chú ý, kết quả nghiên cứu gần đây nhất là sự biến đổi hiệu suất khi bệnh nhân được phân loại theo dòng dõi di truyền. Sử dụng dữ liệu kiểu gen dòng dõi để suy ra dòng dõi, các nhà nghiên cứu phát hiện ra rằng mô hình hiệu suất cao duy trì độ chính xác cao trong các nhóm dòng dõi Âu (AUC 0.84) và Phi (AUC 0.85). Tuy nhiên, có sự sụt giảm đáng kể trong nhóm dòng dõi Á (AUC 0.68). Điều này đặc biệt đáng lo ngại vì các đột biến EGFR phổ biến nhất ở dân số Á (lên tới 50% các trường hợp LUAD). Sự phân kỳ này cho thấy các biểu hiện hình thái học của các đột biến EGFR có thể khác nhau qua các nền tảng dòng dõi hoặc dữ liệu đào tạo gốc—chủ yếu bao gồm dữ liệu từ dân số Âu—không nắm bắt được các đặc điểm tinh tế có mặt ở bệnh nhân Á.
Thách thức Phương pháp: Loại Mẫu và Tính hữu ích trong Phân loại
Tính hữu ích lâm sàng của các mô hình AI cũng được quy định bởi nguồn gốc mẫu. Phân tích các loại mẫu tiết lộ rằng hiệu suất mô hình được tối ưu hóa trên các mẫu mô phổi (AUC 0.86) nhưng giảm đáng kể ở các mẫu màng phổi (AUC 0.66). Điều này có thể phản ánh các môi trường chất nền và thành phần tế bào khác nhau của các vị trí di căn so với các khối u chính, có thể che giấu các dấu hiệu hình thái học mà AI dựa vào.
Bất chấp những hạn chế này, các mô hình AI có tiềm năng cao trong việc phân loại lâm sàng. Bằng cách áp dụng ngưỡng độ tin cậy cao cho các dự đoán AI, các bác sĩ có thể bỏ qua nhu cầu kiểm tra EGFR nhanh chóng ở 57% bệnh nhân trong khi duy trì độ đặc hiệu 0.99. Cách tiếp cận “dương tính phân loại” này đảm bảo rằng chỉ những ứng viên có khả năng cao nhất mới được ưu tiên cho kiểm tra phân tử nhanh chóng, tiết kiệm chi phí và thời gian cho các trường hợp phức tạp hơn.
Bình luận của Chuyên gia
Các phát hiện của Rakaee et al. nhấn mạnh cả hứa hẹn và nguy cơ của việc tích hợp AI vào y học ung thư. Từ góc độ lâm sàng, khả năng dự đoán trạng thái EGFR từ một slide H&E thông thường trong vài phút là một bước tiến phi thường. Tuy nhiên, sự biến đổi liên quan đến dòng dõi là một “cảnh báo đỏ” quan trọng. Nếu một mô hình AI kém chính xác hơn đối với bệnh nhân Á—nhóm rất có khả năng hưởng lợi từ liệu pháp nhắm mục tiêu EGFR—việc triển khai nó có thể vô tình làm trầm trọng thêm các bất bình đẳng chăm sóc sức khỏe hiện có.
Mechanistically, sự giảm hiệu suất trong các nhóm Á và các mẫu màng phổi cho thấy các mô hình AI có thể đang học các đặc điểm liên quan đến môi trường vi mô khối u hoặc các loại hình học cụ thể (ví dụ, mô hình tăng trưởng lepidic vs. solid) liên quan khác nhau với các đột biến EGFR qua các dân số. Các chuyên gia đề xuất rằng việc phát triển mô hình trong tương lai phải ưu tiên “đào tạo nhận thức về dòng dõi”, sử dụng các bộ dữ liệu đa dạng lớn từ các ngân hàng sinh học toàn cầu để đảm bảo hiệu suất công bằng. Hơn nữa, sự giảm hiệu suất trong các mẫu màng phổi cho thấy các mô hình cần được điều chỉnh cụ thể cho các hình thái của các vị trí di căn thay vì dựa vào một thuật toán ung thư phổi “một kích thước phù hợp cho tất cả”.
Kết luận
Các công cụ bệnh lý dựa trên AI đại diện cho một phụ trợ biến đổi trong việc dự đoán EGFR trong ung thư phổi, cung cấp con đường để phân loại nhanh chóng và giảm gánh nặng kiểm tra phân tử. Tuy nhiên, các mô hình hiện tại thể hiện các khoảng cách hiệu suất đáng kể liên quan đến dòng dõi di truyền và nguồn gốc mẫu. Nghiên cứu trong tương lai phải tập trung vào việc đa dạng hóa các bộ dữ liệu đào tạo để bao gồm sự đại diện rộng rãi của các dòng dõi và tối ưu hóa các mô hình cho các ngữ cảnh mô đa dạng. Cho đến khi các khoảng cách này được bắc qua, AI nên được xem như một công cụ sàng lọc sơ bộ—một “phân loại kỹ thuật số”—bổ sung, thay vì thay thế, kiểm tra phân tử chuẩn mực. Cuộc theo đuổi y học ung thư chính xác phải đảm bảo rằng “chính xác” của các công cụ AI được phân phối đồng đều cho tất cả các nhóm bệnh nhân.
Tham khảo
- Rakaee M, Nassar AH, Tafavvoghi M, et al. Ancestry-Associated Performance Variability of Open-Source AI Models for EGFR Prediction in Lung Cancer. JAMA Oncol. 2026;12:e256430. doi:10.1001/jamaoncol.2025.6430. PMID: 41678173.
- Coudray N, Ocampo PS, Sakellaropoulos T, et al. Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning. Nat Med. 2018;24(10):1559-1567. PMID: 30224741.
- Echle A, Rindtorff N, Brinker TJ, et al. Deep learning in cancer pathology: a new frontier for precision oncology. Cancer Cell. 2021;39(2):164-167. PMID: 33592176.

