Các Mô Hình AI Dự Đoán Biến Đổi EGFR Trong Ung Thư Phổi Thể Hiện Sự Khác Biệt Hiệu Suất Dựa Trên Tổ Tiên

Nền Tảng

Biến đổi thụ thể yếu tố tăng trưởng biểu bì (EGFR) là một trong những thay đổi phân tử lâm sàng quan trọng nhất trong ung thư phổi không phải tế bào nhỏ, đặc biệt là ung thư biểu mô phế quản (LUAD). Những biến đổi này đóng vai trò là dấu ấn sinh học dự đoán cho liệu pháp nhắm mục tiêu bằng chất ức chế tyrosine kinase EGFR, đã cải thiện đáng kể kết quả điều trị cho bệnh nhân bị ảnh hưởng. Việc xác định biến đổi EGFR truyền thống dựa trên các phương pháp thử nghiệm phân tử như giải trình tự thế hệ mới (NGS), các bài kiểm tra dựa trên phản ứng chuỗi polymerase hoặc giải trình tự Sanger – tất cả đều yêu cầu lấy mẫu mô và thời gian xử lý phòng thí nghiệm có thể làm chậm việc bắt đầu điều trị.

Trong những năm gần đây, các mô hình trí tuệ nhân tạo (AI) đã nổi lên như những công cụ hứa hẹn để trích xuất thông tin gen từ các slide bệnh lý được nhuộm hematoxylin-eosin (H&E) thường xuyên. Các cách tiếp cận bệnh lý tính toán này nhằm dân chủ hóa quyền truy cập vào hồ sơ phân tử bằng cách tận dụng các mô hình hình thái học liên quan đến các thay đổi di truyền tiềm ẩn. Tuy nhiên, khả năng tổng quát hóa của các mô hình này trong các nhóm bệnh nhân đa dạng và bối cảnh lâm sàng vẫn chưa được đánh giá đầy đủ. Do sự khác biệt giữa các quần thể về tần suất biến đổi EGFR và các yếu tố nhiễu tiềm ẩn như thành phần mô và sự biến đổi trong quá trình nhuộm, việc đánh giá kỹ lưỡng hiệu suất của mô hình AI qua các nhóm tổ tiên là cần thiết trước khi triển khai lâm sàng.

Thiết Kế Nghiên Cứu

Nghiên cứu nhóm hồi cứu này đánh giá hai mô hình AI nguồn mở để dự đoán trạng thái biến đổi EGFR trong ung thư biểu mô phế quản sử dụng dữ liệu hình ảnh toàn bộ slide và hồ sơ phân tử. Cuộc điều tra bao gồm bệnh nhân từ hai nhóm độc lập: nhóm Dana-Farber Cancer Institute (DFCI) bao gồm 1,759 bệnh nhân được điều trị từ tháng 6 năm 2013 đến tháng 11 năm 2023, và nhóm TNM-I dựa tại châu Âu với 339 bệnh nhân được đăng ký từ tháng 8 năm 2016 đến tháng 2 năm 2022.

Tất cả bệnh nhân được bao gồm đều có dữ liệu giải trình tự thế hệ mới xác nhận trạng thái biến đổi EGFR cùng với hình ảnh toàn bộ slide được nhuộm H&E số hóa. Trong nhóm DFCI, tổ tiên di truyền được suy ra từ dữ liệu kiểu gen dòng sinh, cho phép phân loại thành các nhóm tổ tiên đã định: châu Phi (n=54), châu Mỹ (n=101), châu Á (n=95) và châu Âu (n=1,465). Dân số nghiên cứu có độ tuổi trung bình là 66.6 tuổi (ĐK 10.3), với 1,315 bệnh nhân nữ (63%) và 783 bệnh nhân nam (37%). Biến đổi EGFR được phát hiện ở 432 bệnh nhân (25%) trong nhóm DFCI và 50 bệnh nhân (15%) trong nhóm TNM-I.

Kết quả chính là hiệu suất mô hình cho việc dự đoán biến đổi EGFR, được đo bằng diện tích dưới đường cong hoạt động đặc trưng nhận dạng (AUC), được đánh giá tổng thể và qua các nhóm tổ tiên và loại mẫu bao gồm các mẫu phẫu thuật cắt bỏ phổi và sinh thiết màng phổi.

Kết Quả Chính

Nghiên cứu đã chứng minh sự thay đổi hiệu suất đáng kể giữa hai mô hình AI được đánh giá. Trong nhóm DFCI, mô hình có hiệu suất cao hơn đạt AUC 0.83 (95% CI, 0.81-0.85), trong khi mô hình có hiệu suất thấp hơn đạt AUC 0.68 (95% CI, 0.65-0.70). Việc xác nhận trong nhóm TNM-I độc lập đã xác nhận những kết quả này, với AUC 0.81 (95% CI, 0.74-0.88) và 0.75 (95% CI, 0.68-0.83) cho các mô hình tương ứng.

Phân tích theo tổ tiên của nhóm DFCI đã tiết lộ sự khác biệt hiệu suất đáng kể qua các nhóm tổ tiên đối với mô hình có hiệu suất cao hơn. Bệnh nhân có tổ tiên châu Âu thể hiện AUC 0.84 (95% CI, 0.81-0.86), trong khi bệnh nhân có tổ tiên châu Phi thể hiện hiệu suất tương đương với AUC 0.85 (95% CI, 0.72-0.94). Đáng chú ý, bệnh nhân có tổ tiên châu Á thể hiện độ chính xác dự đoán thấp hơn đáng kể với AUC 0.68 (95% CI, 0.55-0.78), đại diện cho sự giảm 16 điểm phần trăm so với bệnh nhân có tổ tiên châu Âu. Bệnh nhân có tổ tiên châu Mỹ tạo thành một nhóm nhỏ hơn mà không có ước lượng phân tầng riêng biệt.

Phân tích loại mẫu cũng cho thấy sự suy giảm hiệu suất trong một số bối cảnh lâm sàng. Mô hình có hiệu suất cao hơn đạt AUC 0.86 (95% CI, 0.83-0.88) trong các mẫu phổi tiêu chuẩn nhưng giảm xuống 0.66 (95% CI, 0.56-0.76) trong các mẫu màng phổi. Sự khác biệt hiệu suất này nhấn mạnh tầm quan trọng của bối cảnh mô trong dự đoán gen dựa trên AI.

Từ góc độ quy trình lâm sàng, phân tích tam cấp được hướng dẫn bởi AI đề xuất rằng việc triển khai mô hình có hiệu suất cao hơn có thể giảm 57% yêu cầu thử nghiệm EGFR nhanh chóng trong khi duy trì độ nhạy 0.84 và độ đặc hiệu 0.99. Những ước lượng này chỉ ra rằng việc sàng lọc trước bằng AI có thể giảm đáng kể khối lượng công việc phòng thí nghiệm mà không làm compromate việc xác định các trường hợp dương tính với biến đổi.

Bình Luận Chuyên Gia

Những phát hiện từ cuộc điều tra này mang lại ý nghĩa đáng kể đối với việc phát triển và triển khai các công cụ bệnh lý tính toán trong y học chính xác. Sự khác biệt hiệu suất được quan sát giữa các nhóm tổ tiên – đặc biệt là sự giảm độ chính xác ở bệnh nhân châu Á – đòi hỏi xem xét cẩn thận về cơ chế tiềm ẩn và các yếu tố nhiễu tiềm ẩn.

Một số yếu tố có thể góp phần vào sự thay đổi hiệu suất liên quan đến tổ tiên được quan sát trong nghiên cứu này. Thứ nhất, sự khác biệt về subtype biến đổi EGFR giữa các quần thể có thể ảnh hưởng đến các đặc điểm hình thái học mà các mô hình AI học để nhận biết. Bệnh nhân châu Á thể hiện tỷ lệ cao hơn của các biến đổi nhạy cảm như xóa đoạn exon 19 và đột biến điểm L858R so với các quần thể khác, nhưng nhóm này đã thể hiện hiệu suất mô hình AI thấp hơn mặc dù tần suất biến đổi cao hơn. Sự tìm thấy này trái ngược này gợi ý rằng các yếu tố khác ngoài tần suất biến đổi có thể đang hoạt động, có thể bao gồm sự khác biệt về hình thái khối u, thành phần môi trường vi mô, hoặc các yếu tố kỹ thuật liên quan đến việc chuẩn bị và số hóa slide.

Việc giảm hiệu suất đáng kể trong các mẫu màng phổi (AUC 0.66) so với các mẫu cắt bỏ phổi (AUC 0.86) nổi bật một hạn chế quan trọng của các cách tiếp cận bệnh lý AI hiện tại. Các mẫu sinh thiết màng phổi thường là mô duy nhất có sẵn ở bệnh nhân giai đoạn tiến triển, khiến việc dự đoán chính xác trở nên đặc biệt quan trọng trong bối cảnh này. Sự suy giảm hiệu suất có thể phản ánh sự khác biệt về cấu trúc mô, hoại tử, hoặc các mô hình viêm nhiễm trong các mẫu di căn hoặc xâm lấn so với các mẫu cắt bỏ nguyên phát.

Từ góc độ triển khai, khả năng giảm 57% khối lượng thử nghiệm EGFR nhanh chóng với độ nhạy duy trì là một lập luận thuyết phục cho việc tam cấp hỗ trợ AI trong các cài đặt hạn chế tài nguyên. Tuy nhiên, sự khác biệt hiệu suất qua các nhóm tổ tiên đòi hỏi xem xét cẩn thận trước khi triển khai lâm sàng rộng rãi. Các quy trình đảm bảo chất lượng, giám sát hiệu suất định kỳ qua các nhân khẩu học bệnh nhân, và giao tiếp minh bạch về giới hạn của mô hình với các bác sĩ sẽ là các thành phần thiết yếu của bất kỳ chiến lược triển khai nào.

Kết Luận

Nghiên cứu nhóm này cung cấp bằng chứng quan trọng về các đặc điểm hiệu suất và hạn chế của các mô hình bệnh lý AI nguồn mở để dự đoán biến đổi EGFR trong ung thư biểu mô phế quản. Mặc dù các công cụ này thể hiện hiệu suất hứa hẹn với các giá trị AUC vượt quá 0.80 trong các nhóm chính, sự thay đổi hiệu suất đáng kể qua các nhóm tổ tiên và loại mẫu đặt ra những xem xét quan trọng về việc triển khai lâm sàng công bằng.

Độ chính xác dự đoán thấp hơn đáng kể ở bệnh nhân có tổ tiên châu Á (AUC 0.68) so với bệnh nhân châu Âu (AUC 0.84) và châu Phi (AUC 0.85) là một sự chênh lệch đáng kể cần được giải quyết thông qua việc tinh chỉnh mô hình liên tục, kết hợp dữ liệu đào tạo đa dạng, và xác thực mạnh mẽ qua các quần thể. Tương tự, sự suy giảm hiệu suất trong các mẫu màng phổi nhấn mạnh nhu cầu xác thực cụ thể cho từng loại mô trước khi áp dụng rộng rãi.

Tiềm năng của tam cấp hỗ trợ AI để giảm khối lượng thử nghiệm phòng thí nghiệm trong khi duy trì độ nhạy cao mang lại lợi ích cụ thể cho việc tối ưu hóa quy trình lâm sàng. Tuy nhiên, để thực hiện những lợi ích này đồng thời đảm bảo chăm sóc công bằng cho tất cả các nhóm bệnh nhân, cần tiếp tục nghiên cứu, xác thực và các chiến lược triển khai cẩn trọng ưu tiên giám sát hiệu suất qua các nhóm nhân khẩu học.

Tài Trợ

Nghiên cứu này được hỗ trợ bởi các khoản tài trợ từ Viện Ung Thư Quốc Gia và quỹ nghiên cứu tổ chức từ Dana-Farber Cancer Institute. Thử nghiệm TNM-I được hỗ trợ bởi quỹ hợp tác nghiên cứu châu Âu.

Tham Khảo

Rakaee M, Nassar AH, Tafavvoghi M, et al. Sự Khác Biệt Hiệu Suất Liên Quan Đến Tổ Tiên Của Các Mô Hình AI Nguồn Mở Dự Đoán Biến Đổi EGFR Trong Ung Thư Phổi. JAMA Oncol. 2026;12(4):402-406. PMID: 41678173.