Phá vỡ rào cản phần cứng: Cách AI chuyển đổi miền cho phép phát hiện bệnh hoàng điểm 3D OCT không phụ thuộc nhà cung cấp

Giới thiệu: Thách thức của sự không đồng nhất trong hình ảnh

Chụp cắt lớp quang học (OCT) đã cách mạng hóa lĩnh vực nhãn khoa, cung cấp các hình ảnh cắt lớp có độ phân giải cao của võng mạc, điều này rất quan trọng cho việc chẩn đoán và quản lý các bệnh hoàng điểm. Tuy nhiên, sự phát triển nhanh chóng của công nghệ OCT đã dẫn đến một thị trường phần cứng phân mảnh. Các nhà sản xuất khác nhau như Heidelberg Engineering (Spectralis) và Zeiss (Cirrus) sử dụng các cấu hình quang học và thuật toán xử lý khác nhau, dẫn đến sự khác biệt về độ tương phản hình ảnh, mức độ nhiễu và độ phân giải không gian. Đối với trí tuệ nhân tạo (AI) và học sâu (DL), sự không đồng nhất này đặt ra một thách thức đáng kể được gọi là chuyển đổi miền. Một mô hình được huấn luyện trên hình ảnh từ một nhà cung cấp thường hoạt động kém khi áp dụng cho hình ảnh từ nhà cung cấp khác, hạn chế khả năng mở rộng và tính thực tế lâm sàng của AI trong các môi trường y tế đa dạng.

Trong một nghiên cứu mang tính đột phá được công bố trên JAMA Ophthalmology, Tang và cộng sự đã giải quyết thách thức này bằng cách phát triển và kiểm chứng một công nghệ AI chuyển đổi miền được thiết kế để phát hiện nhiều bệnh từ các quét 3D OCT mà không phụ thuộc nhà cung cấp. Bằng cách sử dụng phương pháp điều chỉnh miền không giám sát tiên tiến, các nhà nghiên cứu nhằm tạo ra một công cụ chẩn đoán mạnh mẽ có thể duy trì hiệu suất cao trên các nền tảng phần cứng và bối cảnh lâm sàng khác nhau.

Những điểm nổi bật

Độ chính xác chẩn đoán cao trên các nhà cung cấp

Mô hình đã thể hiện hiệu suất mạnh mẽ (AUROC lên đến 0.999) trên các nhà cung cấp OCT khác nhau mặc dù được huấn luyện trên dữ liệu của một nhà sản xuất duy nhất.

Phân loại an toàn

Giá trị dự đoán âm (NPV) vượt quá 97.5% trên tất cả các tập dữ liệu kiểm tra, đảm bảo tỷ lệ bỏ sót bệnh lý thấp trong các tình huống phân loại lâm sàng.

Quản lý sự không xác định

Việc giới thiệu một danh mục không chắc chắn cho phép mô hình xác định và đánh dấu các tình trạng hoàng điểm hiếm gặp hoặc chưa từng thấy trước đó với độ đặc hiệu cao.

Thành công trong điều chỉnh miền

Sử dụng Test Entropy như một phương pháp điều chỉnh miền không giám sát đã hiệu quả trong việc thu hẹp khoảng cách giữa các miền hình ảnh khác nhau mà không cần phải huấn luyện lại rộng rãi.

Thiết kế và phương pháp nghiên cứu

Nghiên cứu hồi cứu đa trung tâm này sử dụng một bộ dữ liệu lớn gồm 18,992 quét OCT từ 6,005 bệnh nhân. Dữ liệu được lấy từ nhiều cơ sở y tế, bao gồm các bệnh viện mắt chuyên khoa, các trung tâm tư nhân và các cơ sở dữ liệu mở ở Hồng Kông và Việt Nam. Thời gian nghiên cứu kéo dài từ tháng 1 năm 2008 đến tháng 9 năm 2022, với việc phát triển mô hình và phân tích diễn ra từ năm 2022 đến 2024.

Công nghệ lõi là một mô hình Mạng Nơron Tàn dư (ResNet) 3D. Khác với nhiều mô hình trước đây tập trung vào các lát cắt 2D (B-scans), kiến trúc này phân tích toàn bộ khối lượng 3D, nắm bắt đầy đủ ngữ cảnh không gian của bệnh lý hoàng điểm. Để đáp ứng yêu cầu không phụ thuộc nhà cung cấp, các nhà nghiên cứu đã sử dụng phương pháp điều chỉnh miền không giám sát tại thời điểm kiểm tra gọi là Test Entropy. Phương pháp này cho phép mô hình điều chỉnh các tham số nội bộ của nó theo thời gian thực dựa trên các thuộc tính thống kê của dữ liệu kiểm tra đến, hiệu quả chuẩn hóa sự khác biệt giữa hình ảnh từ Nhà cung cấp 1 (Spectralis) và Nhà cung cấp 2 (Cirrus).

Mô hình được huấn luyện độc quyền trên các quét 3D từ Nhà cung cấp 1. Sau đó, nó được kiểm tra nghiêm ngặt đối với chín tập dữ liệu, bao gồm các quét 3D từ Nhà cung cấp 1, các quét 3D từ Nhà cung cấp 2, và thậm chí cả các quét 2D để kiểm tra tính linh hoạt của nó. Một sáng tạo quan trọng là mô-đun phân loại, chia các quét thành khẩn cấp, bán khẩn cấp, và thông thường dựa trên bệnh lý được phát hiện, và một danh mục không chắc chắn cho các trường hợp không phân phối (OOD).

Kết quả: Hiệu suất và độ tin cậy lâm sàng

Các kết quả chính được đo lường bao gồm diện tích dưới đường cong hoạt động của máy nhận (AUROC), giá trị dự đoán dương (PPV), và giá trị dự đoán âm (NPV). Kết quả luôn cao trên mọi mặt.

Đối với các quét 3D từ Nhà cung cấp 1, AUROC dao động từ 0.779 đến 0.999. Điều ấn tượng hơn là khi mô hình được áp dụng cho các quét 3D từ Nhà cung cấp 2—dữ liệu mà nó chưa từng thấy trong quá trình huấn luyện—AUROC vẫn mạnh mẽ, dao động từ 0.754 đến 0.991. Khi áp dụng cho các quét 2D, mô hình vẫn đạt AUROC từ 0.801 đến 0.950, nhấn mạnh khả năng thích ứng của nó.

Từ góc độ an toàn lâm sàng, NPV có lẽ là chỉ số quan trọng nhất. Tất cả các micro-average NPV đều vượt quá 97.5%. Điều này có nghĩa là nếu AI gắn nhãn một quét là bình thường hoặc thông thường, có xác suất rất cao là nó không bỏ sót một bệnh lý quan trọng. Về mặt phân loại, tỷ lệ bỏ sót quan trọng lâm sàng cho các trường hợp khẩn cấp (như vi mạch hóa sinh mới do thoái hóa hoàng điểm liên quan tuổi) là 6.16% cho Nhà cung cấp 1 và 6.70% cho Nhà cung cấp 2. Đối với các trường hợp bán khẩn cấp, tỷ lệ bỏ sót là 4.41% và 8.67%, tương ứng.

Đối phó với sự không chắc chắn: Thách thức OOD

Một trong những rủi ro lớn nhất trong AI lâm sàng là sự xuất hiện của các tình trạng mà mô hình không được huấn luyện để nhận biết. Nếu một mô hình bị ép phải phân loại một tình trạng hiếm gặp vào một danh mục đã định trước, nó có thể đưa ra một chẩn đoán sai tự tin. Tang và cộng sự đã giải quyết vấn đề này bằng cách tích hợp một danh mục không chắc chắn. Mô-đun này thể hiện độ đặc hiệu hơn 95.0% và độ chính xác hơn 92.7% trên các tập dữ liệu bên ngoài. Mặc dù độ nhạy của danh mục này thay đổi, sự hiện diện của nó đóng vai trò như một van an toàn quan trọng, đánh dấu các trường hợp phức tạp hoặc hiếm gặp để xem xét của con người thay vì cung cấp một chẩn đoán tự động sai.

Bình luận chuyên gia: Cầu nối khoảng cách triển khai

Thành công của công nghệ chuyển đổi miền này là một bước tiến đáng kể trong AI nhãn khoa. Hầu hết các giải pháp AI hiện tại là cục bộ hoặc độc quyền, hoạt động tốt trong một phòng khám cụ thể sử dụng một máy cụ thể nhưng thất bại trong thế giới thực, nơi phần cứng là đa dạng. Bằng cách chứng minh rằng một mô hình có thể được huấn luyện trên một nhà cung cấp và triển khai thành công trên một nhà cung cấp khác bằng cách sử dụng điều chỉnh không giám sát, các nhà nghiên cứu đã cung cấp một bản thiết kế cho việc triển khai AI quy mô lớn hơn.

Tuy nhiên, còn một số điều cần xem xét. Mặc dù NPV rất tốt, PPV (từ 46.0% đến 72.0%) cho thấy vẫn sẽ xảy ra một số dương tính giả, yêu cầu giám sát của bác sĩ để tránh các lần giới thiệu không cần thiết. Ngoài ra, do đây là một nghiên cứu hồi cứu, tác động thực sự đối với quy trình làm việc lâm sàng và kết quả của bệnh nhân phải được xác minh trong các thử nghiệm thực tế, tiền cứu. Độ nhạy thay đổi của danh mục không chắc chắn cũng cho thấy rằng mặc dù mô hình giỏi trong việc không sai, nó có thể chưa hoàn hảo trong việc xác định mọi tình trạng hiếm gặp.

Cơ chế, việc sử dụng Test Entropy là một cách tiếp cận tinh vi đối với vấn đề chuyển đổi miền. Nó chuyển gánh nặng điều chỉnh từ giai đoạn huấn luyện sang giai đoạn suy luận, khiến mô hình trở nên linh hoạt và đáp ứng hơn với các đặc điểm cụ thể của hình ảnh đang phân tích. Điều này phản ánh một xu hướng rộng lớn hơn trong nghiên cứu AI hướng tới các hệ thống linh hoạt, có ý thức về ngữ cảnh hơn.

Kết luận: Con đường hướng tới chẩn đoán phổ quát

Nghiên cứu của Tang và cộng sự nhấn mạnh tiềm năng cải tạo của các mô hình DL không phụ thuộc nhà cung cấp trong nhãn khoa hiện đại. Bằng cách vượt qua các hạn chế của việc huấn luyện cụ thể phần cứng, công nghệ này mở đường cho việc triển khai rộng rãi trong các cơ sở chăm sóc mắt đa dạng, từ sàng lọc chăm sóc ban đầu đến phân loại tại các bệnh viện chuyên khoa. Các hệ thống như vậy có thể cải thiện đáng kể việc phát hiện các bệnh hoàng điểm, đảm bảo rằng các bệnh nhân có tình trạng khẩn cấp được ưu tiên và giảm gánh nặng tổng thể đối với các chuyên gia chăm sóc mắt.

Nghiên cứu trong tương lai nên tập trung vào việc tích hợp công nghệ này vào hồ sơ sức khỏe điện tử và khám phá ứng dụng của nó trong theo dõi tiến triển bệnh lý dài hạn. Khi AI tiếp tục trưởng thành, trọng tâm có thể chuyển từ độ chính xác chẩn đoán thuần túy sang sự tích hợp liền mạch, đa nền tảng như được thể hiện trong nghiên cứu đa trung tâm này.

Tham khảo

1. Tang ZQ, Zhang YH, Ran AR, et al. Domain-Shift AI Technology for Vendor-Agnostic Multiple Macular Disease Detection From 3D OCT Scans. JAMA Ophthalmol. 2026 Feb 26. doi: 10.1001/jamaophthalmol.2026.0029.
2. Schmidt-Erfurth U, Waldstein SM. A technology update on optical coherence tomography. Invest Ophthalmol Vis Sci. 2014;55(12):8459-8476.
3. Ting DSW, Peng L, Varadarajan AV, et al. Deep learning in ophthalmology: The path to the clinic. Nat Med. 2019;25(2):251-256.