Nổi bật
– Nghiên cứu PANORAMA (đa trung tâm, quốc tế) đã huấn luyện và xác thực bên ngoài hệ thống AI nguồn mở để phát hiện PDAC trên CT đối quang tiêu chuẩn và thử nghiệm nó với 68 bác sĩ hình ảnh trong nghiên cứu đọc cặp.
– Trên tập kiểm tra được bảo mật, AI đạt AUROC 0.92 (95% CI 0.90–0.93); trong nghiên cứu đọc 391 trường hợp, AUROC của AI là 0.92 (0.89–0.94) so với AUROC tổng hợp của các bác sĩ hình ảnh là 0.88 (0.85–0.91).
– Biên độ không thua kém được chỉ định trước (Δ=0.05) đã được đáp ứng (p<0.0001) và AI thể hiện tính vượt trội thống kê (p=0.001) so với các bác sĩ hình ảnh, nhấn mạnh tiềm năng lâm sàng để phát hiện sớm PDAC trên CT thông thường.
Nền tảng: gánh nặng bệnh và nhu cầu chưa được đáp ứng
Ung thư ống tụy (PDAC) vẫn là một trong những khối u rắn phổ biến gây tử vong cao nhất: phần lớn bệnh nhân được chẩn đoán ở giai đoạn tiến triển và tỷ lệ sống sót sau 5 năm thấp bất kể có những cải tiến điều trị tăng dần. Thống kê ung thư toàn cầu tiếp tục ghi nhận tỷ lệ mắc mới tăng và tỷ lệ tử vong cao liên tục đối với ung thư tụy (Sung et al., CA Cancer J Clin 2021). Nguyên nhân chính gây ra kết quả kém là phát hiện muộn; CT đối quang là phương pháp chụp cắt lớp ngang thông thường ban đầu, nhưng các khối u nhỏ và thay đổi tế bào chất tinh tế thường bị bỏ qua hoặc không rõ ràng trên các cuộc kiểm tra tiêu chuẩn, thậm chí tại các trung tâm cấp ba.
Thiết kế nghiên cứu và phương pháp (PANORAMA)
PANORAMA là một nghiên cứu quan sát xác nhận, không thua kém, ghép đôi, quốc tế được thiết kế để đặt chuẩn AI so với người đọc cho việc phát hiện PDAC trên CT đối quang thông thường. Đặc điểm thiết kế chính:
- Dữ liệu: 3.440 bệnh nhân thu thập từ 2004 đến 2023 tại 10 trung tâm cấp ba ở Hà Lan, Hoa Kỳ, Thụy Điển và Na Uy. Tỷ lệ mắc PDAC chung trong nhóm tổng hợp là 32% (1.103/3.440).
- Phát triển mô hình: hệ thống AI nguồn mở được huấn luyện và điều chỉnh trên 2.310 bệnh nhân từ bốn trung tâm (huấn luyện n=2.224; điều chỉnh n=86).
- Thử nghiệm bên ngoài: tập kiểm tra bảo mật gồm 1.130 bệnh nhân từ năm trung tâm (406 trường hợp PDAC được xác nhận bệnh lý) để đánh giá hiệu suất ngoại suy.
- Nghiên cứu quan sát: thiết kế đa người đọc đa trường hợp (MRMC) với 68 bác sĩ hình ảnh từ 40 trung tâm ở 12 quốc gia (kinh nghiệm trung vị 9,0 [IQR 6,0–14,5] năm) đọc một tập con 391 trường hợp (144 trường hợp PDAC được xác nhận bệnh lý) từ tập kiểm tra theo cách ghép đôi.
- Chuẩn tham chiếu: bệnh lý khi có sẵn và ít nhất 3 năm theo dõi lâm sàng để giảm nhầm lẫn.
- Kế hoạch thống kê: biên độ không thua kém được chỉ định trước Δ=0.05 cho AUROC trung bình, sau đó là thử nghiệm vượt trội nếu không thua kém được xác nhận. Phân tích MRMC xem xét mối tương quan giữa người đọc và trường hợp.
Kết quả chính
Hiệu suất của nhóm tổng hợp và tập kiểm tra:
- Trên tập kiểm tra bảo mật 1.130 bệnh nhân (406 trường hợp PDAC được xác nhận bệnh lý), hệ thống AI đạt AUROC 0.92 (95% CI 0.90–0.93), chỉ ra sự phân biệt tuyệt vời.
Nghiên cứu đọc (đánh giá ghép đôi trên 391 trường hợp):
- AUROC của AI: 0.92 (95% CI 0.89–0.94).
- AUROC tổng hợp của các bác sĩ hình ảnh: 0.88 (95% CI 0.85–0.91).
- Suy luận thống kê: Hiệu suất của AI đáp ứng không thua kém (p<0.0001) so với các bác sĩ hình ảnh sử dụng biên độ Δ=0.05 được chỉ định trước, và tiếp tục thể hiện sự vượt trội với p=0.001.
Giải thích kích thước hiệu ứng và ý nghĩa lâm sàng:
Sự chênh lệch AUROC tuyệt đối 0.04 (0.92 so với 0.88) là nhỏ nhưng có ý nghĩa lâm sàng trong bối cảnh PDAC, nơi ngay cả những cải thiện nhỏ về độ nhạy phát hiện ở giai đoạn sớm cũng có thể thay đổi khả năng cắt bỏ và xu hướng sống sót. Thiết kế MRMC và nhóm người đọc quốc tế lớn củng cố tính hợp lệ bên ngoài cho các cài đặt thực hành thông thường tại các trung tâm cấp ba. Chuẩn tham chiếu (bệnh lý cộng thêm theo dõi lâm sàng dài hạn) giảm thiểu nhầm lẫn kết quả gây nhiễu nhiều nghiên cứu hình ảnh hồi cứu.
Quan sát phụ và dữ liệu hoạt động
Nghiên cứu cung cấp thêm thông tin lâm sàng có liên quan mặc dù không phải tất cả đều được báo cáo là điểm cuối chính trong bản tóm tắt: hiệu suất mô hình trên các tổn thương được phân loại theo kích thước/giai đoạn, tỷ lệ dương tính giả (quan trọng cho việc gọi lại và kiểm tra tiếp theo), và ví dụ cấp trường hợp nơi AI sửa chữa sai sót của bác sĩ hình ảnh hoặc ngược lại. Mốc chuẩn nguồn mở được thiết lập bởi PANORAMA cho phép tái tạo độc lập và cải tiến thuật toán bằng cách sử dụng bộ dữ liệu đa trung tâm được quản lý tốt.
Bình luận chuyên gia: ưu điểm, hạn chế và ý nghĩa lâm sàng
Ưu điểm
Các ưu điểm chính của PANORAMA bao gồm bộ dữ liệu lớn, đa dạng về địa lý; tập kiểm tra bên ngoài được bảo mật; kế hoạch thống kê được chỉ định trước với cách tiếp cận không thua kém sau đó là vượt trội; nhóm người đọc bác sĩ hình ảnh lớn và có kinh nghiệm; và chuẩn tham chiếu nghiêm ngặt kết hợp bệnh lý và theo dõi ≥3 năm. Việc sử dụng mốc chuẩn nguồn mở thúc đẩy minh bạch, tái tạo và nghiên cứu tiếp theo.
Hạn chế
Một số lưu ý cần nhấn mạnh trước khi chuyển dịch lâm sàng:
- Sai lệch lựa chọn và phổ: dữ liệu được thu thập từ các trung tâm tham chiếu cấp ba, nơi cấu trúc bệnh và quy trình hình ảnh có thể khác với thực hành cộng đồng, điều này có thể ảnh hưởng đến hiệu chuẩn và tính tổng quát của AI.
- Thiết kế quan sát hồi cứu: mặc dù nghiên cứu đọc được tiến hành theo cách tiền cứu, các trường hợp hình ảnh là hồi cứu. Các yếu tố nhiễu tiềm ẩn và sự thay đổi công nghệ hoặc quy trình máy quét trong thời gian thu thập dài (2004–2023) có thể ảnh hưởng đến hiệu suất.
- Tác động lâm sàng chưa được chứng minh: việc cải thiện các chỉ số chẩn đoán không tự động chuyển thành cải thiện kết quả bệnh nhân. Các câu hỏi quan trọng còn tồn tại về việc liệu phát hiện hỗ trợ AI có tăng tỷ lệ cắt bỏ, thời gian đến điều trị, hay sống sót tổng thể hay không.
- Các yếu tố hoạt động chưa được giải quyết đầy đủ: cân bằng giữa độ nhạy và độ đặc hiệu, gánh nặng dương tính giả, tích hợp vào quy trình làm việc của bác sĩ hình ảnh, xem xét y tế pháp lý và hoàn trả, và khả năng giải thích là quan trọng cho việc áp dụng.
- Sự khác biệt trong quy trình CT: thời gian đối quang, độ dày lát cắt, và khả năng sử dụng nhiều pha khác nhau; tính ổn định của AI đối với sự khác biệt này cần được xác thực bên ngoài cẩn thận tại các địa điểm có quy trình khác nhau.
Ý nghĩa lâm sàng và đường hướng áp dụng
Cho đến nay, PANORAMA đã đưa ra kết quả, một số đường hướng lâm sàng thực tế đáng được khám phá:
- Người đọc thứ hai hoặc đồng thời: AI như một lần đọc tự động thứ hai để đánh dấu các bất thường tụy tinh tế cho bác sĩ hình ảnh xem xét có thể là cách triển khai ban đầu thận trọng nhất, giảm nguy cơ quá phụ thuộc vào thuật toán trong khi tận dụng độ nhạy của nó.
- Sắp xếp và ưu tiên: AI có thể ưu tiên các CT có nguy cơ cao trong danh sách công việc để xem xét nhanh chóng, có thể rút ngắn thời gian chẩn đoán.
- Hỗ trợ quyết định cho các trung tâm có lượng bệnh nhân thấp: tại các bệnh viện có chuyên môn hình ảnh bụng hạn chế, sự hỗ trợ của AI có thể giúp chuẩn hóa hiệu suất phát hiện và giảm thiểu các trường hợp bị bỏ sót.
Bước tiếp theo về nghiên cứu và quy định
Để có trách nhiệm chuyển dịch lợi ích chẩn đoán của PANORAMA thành cải thiện kết quả, một số bước cần thiết:
- Nghiên cứu tác động tiền cứu: các thử nghiệm ngẫu nhiên hoặc chia theo bước đo lường các kết quả trung tâm bệnh nhân (thời gian đến chẩn đoán, tỷ lệ cắt bỏ, sống sót, tác hại của việc khám xét dương tính giả) là cần thiết.
- Xác thực bên ngoài rộng rãi: thử nghiệm mô hình trên các bệnh viện cộng đồng, nhà cung cấp máy quét khác nhau, và các quy trình đối quang đa dạng để đánh giá tính tổng quát và hiệu chuẩn.
- Nghiên cứu triển khai: các nghiên cứu quy trình làm việc để đánh giá sự chấp nhận của bác sĩ hình ảnh, thay đổi thời gian báo cáo, và tích hợp với PACS/RIS, cùng với phân tích hiệu quả chi phí.
- Chấp thuận quy định và giám sát sau thị trường: tuân thủ các quy trình quy định (ví dụ, CE, FDA) và giám sát chặt chẽ cho sự thay đổi bộ dữ liệu và sự giảm hiệu suất trong sử dụng thực tế.
Kết luận
PANORAMA cho thấy hệ thống AI được huấn luyện trên dữ liệu CT đa trung tâm có thể vượt trội hơn một nhóm quốc tế lớn của các bác sĩ hình ảnh trong việc phát hiện PDAC trên CT đối quang thông thường, với AUROC 0.92 so với 0.88. Thiết kế nghiêm ngặt, xác thực bên ngoài, và mốc chuẩn mở của nghiên cứu là những bước tiến đáng chú ý giải quyết các thiếu sót trước đây trong các so sánh AI-hình ảnh. Tuy nhiên, cải thiện độ chính xác chẩn đoán là điểm cuối trung gian—các nghiên cứu tác động tiền cứu là cần thiết để xác định liệu phát hiện hỗ trợ AI có dẫn đến giai đoạn chẩn đoán sớm hơn, nhiều cuộc cắt bỏ điều trị hơn, và cuối cùng là cải thiện sống sót cho bệnh nhân mắc ung thư tụy. Cho đến lúc đó, AI tốt nhất được xem như là một công cụ chẩn đoán mạnh mẽ mà, nếu được xác thực và triển khai cẩn thận, có thể giảm thiểu các trường hợp PDAC bị bỏ sót và tối ưu hóa quy trình làm việc của bác sĩ hình ảnh.
Quỹ và đăng ký
PANORAMA được tài trợ bởi Chương trình Nghiên cứu và Sáng tạo Horizon 2020 của Liên minh châu Âu. Giao thức nghiên cứu và kế hoạch thống kê được chỉ định trước có sẵn công khai qua Zenodo (https://doi.org/10.5281/zenodo.10599559).
Tài liệu tham khảo
1. Alves N, Schuurmans M, Rutkowski D, et al.; PANORAMA consortium. Artificial intelligence and radiologists in pancreatic cancer detection using standard of care CT scans (PANORAMA): an international, paired, non-inferiority, confirmatory, observational study. Lancet Oncol. 2025 Nov 20:S1470-2045(25)00567-4. doi:10.1016/S1470-2045(25)00567-4. PMID: 41275871.
2. Sung H, Ferlay J, Siegel RL, et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA Cancer J Clin. 2021;71(3):209–249. doi:10.3322/caac.21660. PMID: 33538338.
3. McKinney SM, Sieniek M, Godbole V, et al. International evaluation of an AI system for breast cancer screening. Nature. 2020;577(7788):89–94. doi:10.1038/s41586-019-1799-6. PMID: 31803855.
Đề xuất hình ảnh
Một lát cắt ngang đối quang bụng độ phân giải cao tập trung vào tụy, hiển thị một tổn thương giảm hấp thụ tinh tế ở đầu tụy; phủ lên một bản đồ nhiệt mờ nhiều màu do mạng neural tạo ra, nổi bật tổn thương; bao gồm một thanh bên hiển thị các bảng nhỏ về điểm xác suất AI và một nhóm đa dạng các bác sĩ hình ảnh xem xét trường hợp trên màn hình trong phòng đọc tối nhẹ.

