Trí tuệ nhân tạo trong nội soi dạ dày: Giải mã kết quả của một thử nghiệm lâm sàng ngẫu nhiên đa trung tâm mang tính đột phá

Những điểm nổi bật

Trong nhóm 29.514 bệnh nhân, sự hỗ trợ của trí tuệ nhân tạo không cải thiện đáng kể tỷ lệ phát hiện chính xác các khối u dạ dày (RR, 1,13; P = .25).
Sự tích hợp trí tuệ nhân tạo đã giảm đáng kể các điểm mù từ trung bình 2,52 xuống 1,07, cho thấy vai trò quan trọng trong việc chuẩn hóa chất lượng nội soi.
Phân tích khám phá đã xác định những lợi ích đáng kể cho các bác sĩ nội soi ít kinh nghiệm và trong các khoảng thời gian mệt mỏi lâm sàng cao.
Hệ thống trí tuệ nhân tạo đạt 100% độ nhạy chẩn đoán đối với ung thư niêm mạc dạ dày xác nhận bằng bệnh lý, mặc dù hiệu quả của nó trong các tổn thương nội bì thấp cấp vẫn còn hạn chế.

Bối cảnh

Ung thư dạ dày vẫn là một trong những nguyên nhân hàng đầu gây tử vong do ung thư trên toàn thế giới, đặc biệt là ở Đông Á. Tiên lượng phụ thuộc nặng nề vào giai đoạn tại thời điểm chẩn đoán; tuy nhiên, việc phát hiện các khối u dạ dày sớm vẫn là một thách thức lâm sàng đáng kể. Nội soi tiêu hóa trắng thông thường (EGD) là tiêu chuẩn vàng cho sàng lọc, nhưng nó bị hạn chế bởi các yếu tố con người, bao gồm kinh nghiệm của bác sĩ nội soi, mệt mỏi thủ thuật và khó khăn cố hữu trong việc nhận dạng các thay đổi niêm mạc tinh vi. Các nghiên cứu trước đây ước tính rằng đến 20% các trường hợp ung thư dạ dày có thể bị bỏ sót trong quá trình nội soi thông thường.

Để giải quyết những hạn chế này, các hệ thống hỗ trợ phát hiện (CADe) và chẩn đoán (CADx) dựa trên học sâu đã được phát triển. Mặc dù các nghiên cứu giai đoạn sớm và thử nghiệm đơn trung tâm đã cho thấy hứa hẹn, nhưng bằng chứng chất lượng cao từ các thử nghiệm lâm sàng ngẫu nhiên đa trung tâm, quy mô lớn (RCT) vẫn còn hiếm. Nghiên cứu gần đây của Dong et al., được công bố trên Gastroenterology, cung cấp một đánh giá quan trọng về các công nghệ này trong một môi trường lâm sàng thực tế, có lưu lượng cao.

Nội dung chính

Phương pháp và thiết kế nghiên cứu

Thử nghiệm được tiến hành tại 24 bệnh viện ở Trung Quốc từ tháng 12 năm 2021 đến tháng 11 năm 2023. Nó sử dụng thiết kế ngẫu nhiên mạnh mẽ, tuyển chọn một nhóm mẫu lớn 29.514 người tham gia. Bệnh nhân được ngẫu nhiên hóa để thực hiện EGD được hỗ trợ bởi trí tuệ nhân tạo hoặc EGD thông thường, không được hỗ trợ. Kết quả chính là tỷ lệ phát hiện khối u dạ dày (bao gồm ung thư dạ dày và tổn thương nội bì) sau khi xem xét bệnh lý trung tâm kỹ lưỡng. Kết quả phụ được thiết kế để thu thập tác động lâm sàng rộng hơn, bao gồm số lượng điểm mù, thời gian kiểm tra và tỷ lệ phát hiện các tổn thương tiền驱 (如肠化生和胃萎缩).

主要和次要结果

与一些较小的试点研究相反，意向治疗（ITT）分析显示，人工智能并未显著提高病理确诊的胃肿瘤检测率。人工智能组的检测率为1.42%，而对照组为1.25%（相对风险[RR]，1.13；95%置信区间，0.92-1.38；P = .25）。

然而，几个次要结果提供了系统性能的细致见解：

原始病理差异：基于原始病理报告（在中央审查之前），人工智能组的检测率有统计学上的显著改善（4.06% 对 3.57%；RR，1.14；P = .03）。这表明人工智能可能识别了更多临界或受病理学家间变异影响的病变。
质量控制：最引人注目的发现之一是“盲点”的减少。人工智能系统实时监控黏膜覆盖情况，将平均未覆盖区域数量从2.52减少到1.07（P < .001）。这表明，尽管人工智能可能不会改变每个病变的生物学检测，但它显著提高了检查的彻底性。
程序指标：人工智能辅助程序与更长的检查时间和总程序时间相关。这可能反映了评估人工智能生成警报和执行系统提示的额外活检所需的时间。

亚组和敏感性分析

亚组分析或许提供了最具临床行动性的数据。人工智能对经验较少的内镜医生的益处更为明显。此外，在“疲劳期”（班次后期或高流量日），人工智能系统充当了一个重要的安全网，维持了本可能因人为错误而下降的检测率。在诊断准确性方面，该系统对晚期病变的敏感度极高，确认的腺癌检测率为100%，高级别上皮内瘤变的检测率为91.9%，但对低级别病变的敏感度较低（57.1%）。

专家评论

这项试验的结果提出了一个需要谨慎解释的悖论。虽然研究未能达到其主要终点，但这些数据不应被视为人工智能技术的失败。相反，它突显了参与中心内镜医生的高基线水平，这可能造成了“天花板效应”。在基线检测率已经很高的中心，人工智能对绝对检测率的增量益处更难在统计上证明。

盲点的显著减少可以说与检测率本身一样重要。在临床实践中，检查的一致性是长期癌症预防的代理指标。通过确保所有解剖区域都被可视化，人工智能系统提供了一种标准化的护理水平，这种水平较少依赖于个别内镜医生的精神状态或日程安排。然而，程序时间的增加和原始与复审病理之间的差异表明存在“过度诊断”的风险，或者至少是临床不重要病变活检的增加。临床医生必须在追求100%敏感性和程序效率低下以及良性活检引起的患者焦虑之间取得平衡。

结论

这项多中心RCT提供了迄今为止关于人工智能在上消化道内镜中作用的最全面数据。虽然在专家手中，人工智能辅助设备可能还不是提高病理确诊胃肿瘤检测率的“灵丹妙药”，但其在质量保证、培训教育和疲劳缓解方面的作用不容忽视。盲点的减少代表了程序标准化的重大进展。

未来的研究应集中于改进人工智能算法以提高对低级别病变的特异性，并调查其对间隔胃癌发生率的长期影响。目前，人工智能应被视为增强程序质量的复杂“副驾”，而不是临床判断的替代品。

参考文献

Dong Z, Wu L, Du H, et al. Effect of a Computer-Aided Device for Detecting Gastric Neoplasms: A Multicenter, Randomized Controlled Trial. Gastroenterology. 2026; PMID: 41801173.
Pimentel-Nunes P, et al. Endoscopic submucosal dissection: European Society of Gastrointestinal Endoscopy (ESGE) Guideline. Endoscopy. 2022. (上下文指南).
Zhang M, et al. Deep learning in gastric cancer: A review. World J Gastroenterol. 2023. (上下文综述).