Công nghệ AI có làm cho bác sĩ nội soi lười biếng không? Dữ liệu đa trung tâm mới cho thấy tỷ lệ phát hiện u tuyến giảm sau khi tiếp xúc với AI

Công nghệ AI có làm cho bác sĩ nội soi lười biếng không? Dữ liệu đa trung tâm mới cho thấy tỷ lệ phát hiện u tuyến giảm sau khi tiếp xúc với AI

Nổi bật

  • Tiếp xúc liên tục với hệ thống hỗ trợ phát hiện polyp bằng AI đã liên quan đến sự giảm 6,0% tuyệt đối về tỷ lệ phát hiện u tuyến (ADR) cho các thủ thuật nội soi đại tràng tiêu chuẩn không sử dụng AI sau đó (từ 28,4% xuống 22,4%; p=0,0089) trong một nghiên cứu quan sát đa trung tâm (trung tâm tham gia thử nghiệm ACCEPT).
  • Trong phân tích đa biến, tiếp xúc với AI vẫn liên quan độc lập với ADR thấp hơn (OR 0,69), trong khi độ tuổi bệnh nhân cao và giới tính nam dự đoán ADR cao hơn.
  • Kết quả này cho thấy khả năng ‘giảm kỹ năng’ hoặc thay đổi hành vi của người điều hành sau khi sử dụng AI thường xuyên; ý nghĩa bao gồm nhu cầu giám sát, điều chỉnh đào tạo và thay đổi thiết kế AI để giảm sự phụ thuộc.

Nền tảng: Tại sao ADR và hiệu suất của con người lại quan trọng

Tỷ lệ phát hiện u tuyến (ADR) là chỉ số chất lượng quan trọng trong nội soi đại tràng vì ADR cao hơn có liên quan chặt chẽ với nguy cơ ung thư đại trực tràng và tử vong do ung thư đại trực tràng thấp hơn. Dữ liệu dân số cho thấy mỗi 1% tăng ADR đều mang lại sự giảm nguy cơ ung thư đại trực tràng sau nội soi có thể đo lường được. Vì vậy, các can thiệp thay đổi ADR—dương tính hoặc âm tính—có ảnh hưởng trực tiếp đến kết quả của bệnh nhân và hiệu quả của chương trình sàng lọc.
Công nghệ AI, đặc biệt là hệ thống phát hiện hỗ trợ máy tính thời gian thực (CADe), đã được phát triển để hỗ trợ bác sĩ nội soi bằng cách đánh dấu các polyp tiềm năng trong quá trình nội soi đại tràng. Các nghiên cứu ngẫu nhiên và quan sát đã báo cáo ADR cải thiện khi AI hoạt động, và AI đang được triển khai nhanh chóng tại các đơn vị nội soi trên toàn thế giới. Tuy nhiên, việc tiếp xúc liên tục với AI có thay đổi hành vi của bác sĩ nội soi khi AI không sẵn có (ví dụ, trong thời gian hệ thống ngừng hoạt động hoặc tại các đơn vị không có AI) hay không chưa được mô tả rõ ràng. Khả năng của sự chủ quan do tự động hóa, phụ thuộc quá mức hoặc thay đổi chiến lược tìm kiếm gây lo ngại về việc giảm kỹ năng không chủ đích—trong đó hiệu suất độc lập của người dùng suy giảm theo thời gian do phụ thuộc vào sự hỗ trợ tự động.

Thiết kế nghiên cứu

Nghiên cứu quan sát đa trung tâm hồi cứu này sử dụng dữ liệu từ bốn trung tâm nội soi ở Ba Lan tham gia thử nghiệm ACCEPT. Các trung tâm đã giới thiệu công cụ phát hiện polyp bằng AI vào cuối năm 2021 và, theo yêu cầu của thử nghiệm, các thủ thuật nội soi đại tràng trong giai đoạn sau triển khai được phân ngẫu nhiên thành AI hoặc chăm sóc tiêu chuẩn theo ngày khám. Các nhà nghiên cứu đã so sánh các thủ thuật nội soi đại tràng tiêu chuẩn không sử dụng AI được thực hiện trong hai khoảng thời gian: 3 tháng trước khi giới thiệu AI (trước AI) và 3 tháng sau khi giới thiệu AI nhưng thủ thuật được thực hiện mà không sử dụng AI (sau tiếp xúc AI). Điều kiện bao gồm các thủ thuật nội soi chẩn đoán; các trường hợp ngoại lệ bao gồm sử dụng chống đông máu cường độ cao, thai kỳ, đã phẫu thuật cắt bỏ đại trực tràng trước đây hoặc bệnh viêm ruột.
Kết quả chính là sự thay đổi về ADR cho các thủ thuật nội soi đại tràng tiêu chuẩn, không sử dụng AI trước và sau khi tiếp xúc thường xuyên với AI. Phân tích thứ cấp bao gồm hồi quy logistic đa biến để xác định các yếu tố dự đoán độc lập của ADR, và thống kê mô tả về nhân khẩu học bệnh nhân và loại thủ thuật.

Kết quả chính

Dân số và thủ thuật
Từ ngày 8 tháng 9 năm 2021 đến ngày 9 tháng 3 năm 2022, nghiên cứu đã đánh giá 1.443 thủ thuật nội soi đại tràng không sử dụng AI: 795 thủ thuật được thực hiện trước khi triển khai AI và 648 thủ thuật được thực hiện sau khi AI có sẵn tại các trung tâm nhưng không được sử dụng cho các thủ thuật đó. Độ tuổi trung bình của bệnh nhân là 61 tuổi (IQR 45–70); 58,7% là nữ.
Kết quả chính: Sự thay đổi ADR
Tỷ lệ phát hiện u tuyến cho thủ thuật nội soi đại tràng tiêu chuẩn đã giảm từ 28,4% (226/795) trước khi triển khai AI xuống 22,4% (145/648) sau khi tiếp xúc với AI—hiệu ứng tuyệt đối là −6,0% (95% CI −10,5 đến −1,6; p=0,0089). Kết quả này cho thấy sự giảm hiệu suất phát hiện có ý nghĩa thống kê và lâm sàng khi các bác sĩ nội soi thực hiện thủ thuật nội soi đại tràng mà không có AI sau khi họ đã làm việc thường xuyên với các hệ thống AI.
Các yếu tố dự đoán ADR đa biến
Sau khi điều chỉnh các yếu tố nhiễu tiềm ẩn, tiếp xúc với AI vẫn liên quan độc lập với ADR thấp hơn (tỷ lệ cược [OR] 0,69; 95% CI 0,53–0,89). Các yếu tố dự đoán độc lập khác liên quan đến ADR cao hơn là giới tính nam của bệnh nhân (OR 1,78; 95% CI 1,38–2,30) và độ tuổi bệnh nhân ≥60 tuổi so với <60 tuổi (OR 3,60; 95% CI 2,74–4,72). Các mối quan hệ nhân khẩu học này phù hợp với các mối quan hệ đã biết giữa các yếu tố bệnh nhân và tần suất xuất hiện polyp.
Giải thích về mức độ và ý nghĩa lâm sàng
Việc giảm 6% tuyệt đối về ADR là có ý nghĩa: với mối liên hệ đã được xác định rõ ràng giữa ADR và ung thư đại trực tràng, sự giảm này có thể chuyển hóa thành nguy cơ ung thư cao hơn ở cấp độ dân số nếu duy trì. Phân tích đa biến củng cố mối liên hệ bằng cách chứng minh rằng sự giảm không chỉ giải thích bởi sự thay đổi trong độ tuổi hoặc phân phối giới tính của bệnh nhân. Tuy nhiên, nghiên cứu là quan sát và không thể chứng minh mối quan hệ nhân quả; các giải thích thay thế và sai lệch vẫn có thể xảy ra (xem phần hạn chế dưới đây).

Bình luận chuyên gia và các cân nhắc cơ chế

Tại sao ADR có thể giảm sau khi tiếp xúc với AI? Có nhiều cơ chế có thể xảy ra:

  • Chủ quan do tự động hóa/quá phụ thuộc: Các bác sĩ nội soi quen với việc AI gợi ý có thể giảm sự cảnh giác trong việc tìm kiếm hình ảnh khi công cụ không có mặt, dẫn đến bỏ sót tổn thương.
  • Thay đổi chiến lược tìm kiếm: AI có thể thay đổi cách các bác sĩ quét niêm mạc—tập trung vào các gợi ý của AI và có thể bỏ qua các kỹ thuật kiểm tra niêm mạc hệ thống cần thiết khi AI không có mặt.
  • Chuyển tải nhận thức: Các bác sĩ nội soi có thể dựa vào AI để phát hiện các dấu hiệu thoáng qua hoặc tinh vi và giảm quá trình phát hiện nỗ lực.
  • Các yếu tố lựa chọn và quy trình làm việc: Khi AI được sử dụng trong một số trường hợp nhưng không phải tất cả, sự khác biệt về quy trình làm việc hoặc lịch trình (ví dụ, các trường hợp phức tạp hơn được gán AI) có thể làm sai lệch sự thay đổi ADR quan sát được.

Các giả thuyết này phù hợp với tài liệu về yếu tố con người mô tả cách tự động hóa có thể vừa hỗ trợ vừa làm suy yếu kỹ năng của người điều hành tùy thuộc vào thiết kế, phản hồi và phân bổ nhiệm vụ.
Ý nghĩa lâm sàng và đào tạo
Nghiên cứu này nhấn mạnh nhu cầu về các chiến lược chủ động để bảo tồn và giám sát kỹ năng của bác sĩ nội soi khi AI được tích hợp vào thực hành. Các biện pháp có thể bao gồm:

  • Giám sát liên tục ADR ở cấp độ cá nhân bất kể việc sử dụng AI, với ngưỡng thấp hơn để thúc đẩy đào tạo lại hoặc xem xét.
  • Chương trình đào tạo có cấu trúc dạy phát hiện polyp cả với và không có AI, nhấn mạnh các kỹ năng tìm kiếm hình ảnh cơ bản, kỹ thuật rút lui, bơm khí và phơi bày niêm mạc.
  • Mô hình luân phiên hoặc phân chia thực hành đảm bảo các bác sĩ thực hiện tối thiểu một lượng thủ thuật không sử dụng AI để duy trì năng lực độc lập.
  • Thay đổi thiết kế thiết bị và giao diện như các chế độ AI hỗ trợ học tập (chế độ đào tạo), giảm dần độ hiển thị của gợi ý, hoặc phản hồi kép khuyến khích quyết định độc lập.
  • Công cụ mô phỏng và đánh giá năng lực để đo lường kỹ năng phát hiện theo thời gian.

Hạn chế và các giải thích thay thế

Các lưu ý quan trọng hạn chế việc diễn giải các kết quả này:

  • Thiết kế quan sát, không ngẫu nhiên: Mặc dù đã sử dụng so sánh trước/sau với điều chỉnh đa biến, các yếu tố nhiễu còn lại và xu hướng thời gian có thể giải thích một phần hoặc toàn bộ sự giảm ADR quan sát được.
  • Sự khác biệt về trường hợp và lịch trình: Ngay cả với các trường hợp ngoại lệ, các sự khác biệt không đo lường được về chỉ định, chất lượng chuẩn bị ruột, gây mê hoặc tần suất xuất hiện tổn thương giữa các giai đoạn có thể ảnh hưởng đến ADR.
  • Sai lệch Hawthorne và hiệu suất: Việc biết mình đang bị quan sát hoặc tham gia thử nghiệm có thể thay đổi hành vi. Hơn nữa, việc phân bổ khám cho AI hoặc không AI trong giai đoạn sau triển khai (ngẫu nhiên theo ngày) có thể tạo ra sự khác biệt hệ thống.
  • Khoảng thời gian quan sát ngắn: Phân tích sử dụng khoảng thời gian 3 tháng trước và sau. Cần theo dõi lâu dài để xác định xem sự giảm có tạm thời (ví dụ, trong giai đoạn điều chỉnh) hay kéo dài.
  • Tính tổng quát: Nghiên cứu được tiến hành tại bốn trung tâm ở Ba Lan; kết quả có thể khác nhau trong các hệ thống y tế khác, môi trường có các mô hình đào tạo khác nhau hoặc với các hệ thống AI khác.
  • Các yếu tố bác sĩ không đo lường: Kinh nghiệm cá nhân của bác sĩ nội soi, ADR cơ bản và thái độ đối với AI không được chi tiết trong tóm tắt ngắn gọn—những yếu tố này có thể ảnh hưởng đến hiệu ứng.

Cho nên, dữ liệu này chỉ tạo ra giả thuyết chứ không phải là bằng chứng xác định về nguyên nhân.

Lời khuyên thực tế cho bác sĩ và đơn vị

  • Giám sát ADR liên tục ở cấp độ cá nhân của bác sĩ nội soi, phân loại theo việc sử dụng AI, và điều tra ngay lập tức bất kỳ sự giảm không mong muốn nào.
  • Duy trì năng lực thông qua giáo dục liên tục bao gồm việc củng cố kỹ năng phát hiện không sử dụng AI—kỹ thuật rút lui, trực quan hóa niêm mạc và kiểm tra hệ thống.
  • Khi triển khai AI, lên kế hoạch khoa học triển khai: xác định các kết quả mong đợi, thu thập các chỉ số hiệu suất cơ bản và đưa vào các bước để giảm sự giảm kỹ năng (ví dụ, các buổi đào tạo chế độ kép).
  • Tham gia các chuyên gia về yếu tố con người và ergonomics khi tích hợp AI để thiết kế các giao diện hỗ trợ sự cảnh giác, giảm sự phụ thuộc quá mức và cung cấp phản hồi giáo dục.
  • Báo cáo thời gian ngừng hoạt động của thiết bị và thiết lập các quy trình để thực hiện các thủ thuật không sử dụng AI chất lượng cao khi hệ thống không có sẵn.

Nghiên cứu và ưu tiên chính sách

Nghiên cứu này đặt ra các câu hỏi cấp bách cho nghiên cứu và quản lý thêm:

  • Cần các thử nghiệm ngẫu nhiên hoặc thiết kế hoán vị để xác định tác động nhân quả của việc tiếp xúc với AI đối với hiệu suất không hỗ trợ và xác định thời gian và khả năng đảo ngược của bất kỳ sự giảm kỹ năng nào.
  • Các nghiên cứu theo dõi dài hạn theo dõi các bác sĩ qua các khoảng thời gian dài hơn có thể làm rõ xem sự giảm có tạm thời hay tiến triển và xác định các yếu tố dễ bị tổn thương cá nhân.
  • Điều tra các đặc điểm thiết kế AI (ví dụ, tần suất và tầm quan trọng của các gợi ý, chế độ đào tạo) nhằm giảm thiểu các tác động tiêu cực về hành vi.
  • Hướng dẫn chính sách và các đường dẫn phê duyệt thiết bị nên xem xét không chỉ hiệu quả khi AI hoạt động mà còn các tác động của việc sử dụng AI thường xuyên đối với hiệu suất không hỗ trợ của người điều hành.

Kết luận

Nghiên cứu quan sát đa trung tâm này cung cấp một tín hiệu quan trọng ban đầu rằng việc tiếp xúc thường xuyên với hệ thống hỗ trợ phát hiện polyp bằng AI có thể liên quan đến việc giảm ADR khi các bác sĩ thực hiện thủ thuật nội soi đại tràng mà không có AI. Kết quả này có thể hiểu từ góc độ yếu tố con người và có ý nghĩa lâm sàng do mối liên hệ giữa ADR và kết quả ung thư. Tuy nhiên, thiết kế quan sát và khả năng nhiễu hạn chế việc suy luận nhân quả. Bác sĩ, nhà thiết kế thiết bị và hệ thống y tế nên chủ động giám sát hiệu suất của bác sĩ nội soi, điều chỉnh đào tạo và thiết kế các hệ thống AI để hỗ trợ—không thay thế—các kỹ năng nội soi cơ bản. Cần thêm nghiên cứu kiểm soát và theo dõi dài hạn để xác nhận hiện tượng, làm sáng tỏ cơ chế và phát triển các chiến lược giảm thiểu hiệu quả.

Quỹ và Thông tin Thử nghiệm

Nghiên cứu được báo cáo đã được tài trợ bởi Ủy ban Châu Âu và Hiệp hội Khuyến tiến Khoa học Nhật Bản. Công việc sử dụng dữ liệu từ các trung tâm tham gia thử nghiệm ACCEPT (Trí tuệ nhân tạo trong nội soi đại tràng để phòng ngừa ung thư).

Tài liệu tham khảo được chọn

1. Budzyń K, Romańczyk M, Kitala D, et al. Risk of endoscopist deskilling after exposure to artificial intelligence in colonoscopy: a multicentre, observational study. Lancet Gastroenterol Hepatol. 2025 Oct;10(10):896-903. doi: 10.1016/S2468-1253(25)00133-5.
2. Corley DA, Jensen CD, Marks AR, et al. Adenoma detection rate and risk of colorectal cancer and death. N Engl J Med. 2014;370:1298–1306. PMID: 24881923.
(Đóng góp văn học về nội soi đại tràng hỗ trợ AI và ADR đang phát triển nhanh chóng; bác sĩ nên tham khảo các bài đánh giá hệ thống gần đây và hướng dẫn của hội đồng để có bằng chứng và khuyến nghị triển khai mới nhất.)

Comments

No comments yet. Why don’t you start the discussion?

Để lại một bình luận