Đánh giá Báo cáo EMG được Tăng cường bởi AI: Những hiểu biết từ Thử nghiệm Điều khiển Ngẫu nhiên

Đánh giá Báo cáo EMG được Tăng cường bởi AI: Những hiểu biết từ Thử nghiệm Điều khiển Ngẫu nhiên

Nhấn mạnh

  • Công cụ hỗ trợ giải thích AI (INSPIRE) đã được thử nghiệm so với báo cáo EMG chỉ của bác sĩ trong một thử nghiệm điều khiển ngẫu nhiên bao gồm 200 bệnh nhân.
  • Báo cáo tích hợp AI-bác sĩ không cho thấy sự cải thiện đáng kể về độ chính xác hoặc đầy đủ so với báo cáo chỉ của bác sĩ dựa trên điểm Báo cáo EMG được Tạo ra bởi AI (AIGERS) mới.
  • Bác sĩ báo cáo mức độ tin tưởng trung bình vào các đề xuất của AI nhưng lưu ý các vấn đề về khả năng sử dụng, hiệu quả và gián đoạn quy trình làm việc.
  • Hỗ trợ AI có thể vẫn giảm gánh nặng tài liệu bằng cách tự động hóa các yếu tố báo cáo EMG thông thường, có thể cho phép bác sĩ tập trung vào các trường hợp phức tạp.

Nền tảng Nghiên cứu và Gánh nặng Bệnh

Các nghiên cứu chẩn đoán điện (EDX), bao gồm điện cơ đồ (EMG) và các nghiên cứu dẫn truyền thần kinh, là công cụ chẩn đoán quan trọng cho các rối loạn thần kinh cơ như bệnh lý thần kinh, bệnh lý cơ và bệnh lý tế bào vận động. Việc giải thích chính xác các kết quả EDX là thiết yếu cho chẩn đoán, tiên lượng và lập kế hoạch điều trị phù hợp. Tuy nhiên, việc giải thích dữ liệu EDX đòi hỏi kiến thức chuyên sâu, và có thể tồn tại sự khác biệt giữa các bác sĩ do độ phức tạp và các yếu tố chủ quan trong phân tích.

Công nghệ trí tuệ nhân tạo (AI) mới nổi cung cấp tiềm năng để chuẩn hóa việc giải thích EDX, cải thiện độ chính xác và giảm khối lượng công việc của bác sĩ bằng cách tự động hóa việc tạo báo cáo. Tuy nhiên, bằng chứng lâm sàng đánh giá các công cụ AI cho báo cáo EDX vẫn còn ít. Thử nghiệm này nhằm mục đích lấp đầy khoảng trống này bằng cách so sánh một khung đa đại lý hỗ trợ AI, INSPIRE, với việc giải thích chỉ của bác sĩ trong một thiết kế điều khiển ngẫu nhiên nghiêm ngặt.

Thiết kế Nghiên cứu

Thử nghiệm này là một thử nghiệm điều khiển ngẫu nhiên, đơn trung tâm, triển vọng, đã đăng ký 200 bệnh nhân được chỉ định cho các nghiên cứu EDX lâm sàng từ 363 bệnh nhân được sàng lọc ban đầu. Người tham gia được phân bổ ngẫu nhiên 1:1 vào nhóm đối chứng với việc giải thích EMG chỉ của bác sĩ hoặc nhóm can thiệp với việc giải thích kết hợp AI và bác sĩ.

Ba bác sĩ thần kinh được chứng nhận và đào tạo về EDX luân phiên qua cả hai nhóm để giảm thiểu thiên lệch của người điều hành. Trong nhóm can thiệp, INSPIRE tạo ra một báo cáo sơ bộ của AI, sau đó được xem xét cùng với giải thích độc lập của bác sĩ để tạo ra một báo cáo tích hợp. Điểm hiệu quả chính là chất lượng của các báo cáo EDX được đo bằng điểm Báo cáo EMG được Tạo ra bởi AI (AIGERS) mới, một thước đo định lượng từ 0 đến 1, với điểm số cao hơn biểu thị độ chính xác và đầy đủ chẩn đoán cao hơn.

Kết quả phụ bao gồm điểm Đánh giá Tích hợp AI (PAIR) do bác sĩ báo cáo, đánh giá sự tin tưởng, hiệu quả, dễ sử dụng và tác động đến khối lượng công việc, cũng như một cuộc khảo sát tuân thủ đánh giá khả năng áp dụng AI trong thực hành lâm sàng.

Kết quả Chính

Thử nghiệm đã đăng ký 200 bệnh nhân được chia đều giữa hai nhóm. Các báo cáo sơ bộ do AI tạo ra riêng lẻ đã thể hiện sự nhất quán trung bình theo thước đo AIGERS. Tuy nhiên, các báo cáo tích hợp bác sĩ cộng với AI không vượt trội về mặt thống kê so với báo cáo chỉ của bác sĩ về kết quả chính (điểm AIGERS trung bình tương tự, p > 0.05).

Trong khi công cụ AI hiệu quả đề xuất thuật ngữ chuẩn và cấu trúc báo cáo, hiệu ứng này không chuyển đổi thành cải thiện đáng kể về chất lượng tổng thể của báo cáo. Sự thiếu vắng của sự vượt trội thống kê cho thấy hỗ trợ AI có thể chưa vượt qua việc giải thích chỉ của bác sĩ chuyên gia về độ chính xác trong báo cáo EMG.

Phản hồi của bác sĩ cho thấy sự chấp nhận khác nhau đối với các đề xuất của AI. Mức độ tin tưởng vào các đề xuất của AI trung bình 3.7 trên 5, chỉ ra sự tự tin trung bình. Ngược lại, điểm đánh giá hiệu quả hoạt động (2.0/5), dễ sử dụng (1.7/5) và giảm khối lượng công việc (1.7/5) thấp. Những kết quả này cho thấy những thách thức đáng kể về khả năng sử dụng, bao gồm gián đoạn quy trình làm việc và lo ngại về khả năng diễn giải các đầu ra của AI.

Dù có những hạn chế này, các quan sát định tính cho thấy AI có thể giảm thời gian dành cho các phân tích EMG thông thường hoặc đơn giản bằng cách tự động hóa việc tạo văn bản báo cáo hoặc gắn cờ thuật ngữ chuẩn, có thể giúp bác sĩ tập trung vào các trường hợp chẩn đoán phức tạp.

Bình luận Chuyên gia

Thử nghiệm này đóng góp vào việc đánh giá ngày càng phát triển về vai trò của AI trong chẩn đoán thần kinh cơ bằng cách cung cấp dữ liệu ngẫu nhiên nghiêm ngặt. Kết quả nhấn mạnh rằng mặc dù các công cụ AI hứa hẹn hỗ trợ việc giải thích EDX, các triển khai hiện tại như INSPIRE có thể vẫn gặp khó khăn trong việc tích hợp lâm sàng, đặc biệt là về khả năng sử dụng và sự tin tưởng của bác sĩ.

Điểm mạnh của nghiên cứu bao gồm thiết kế triển vọng, ngẫu nhiên, sự tham gia của nhiều bác sĩ và việc tạo ra một hệ thống chấm điểm chất lượng định lượng (AIGERS) được tùy chỉnh cho các báo cáo EDX. Hạn chế bao gồm việc đặt ở một trung tâm duy nhất và kích thước mẫu tương đối nhỏ có thể không đủ mạnh để phát hiện các lợi ích tinh vi. Hơn nữa, hiệu suất AI có thể cải thiện với việc huấn luyện lặp đi lặp lại và tích hợp các bộ dữ liệu rộng lớn hơn.

Hướng dẫn hiện tại chưa bao gồm việc giải thích EDX được hỗ trợ bởi AI nhưng công nhận nhu cầu cấp bách về các công cụ hỗ trợ quyết định nâng cao để giảm bớt khối lượng công việc của các chuyên gia trong bối cảnh nhu cầu ngày càng tăng đối với chẩn đoán thần kinh cơ. Nghiên cứu trong tương lai nên khám phá việc tinh chỉnh các thuật toán AI để cải thiện khả năng diễn giải, cải tiến giao diện người dùng và đánh giá trên các môi trường lâm sàng đa dạng.

Kết luận

Tóm lại, hệ thống giải thích EMG được hỗ trợ bởi AI INSPIRE không vượt trội đáng kể so với báo cáo chỉ của bác sĩ chuyên gia trong thử nghiệm điều khiển ngẫu nhiên này. Tuy nhiên, tiềm năng của AI để giảm bớt nỗ lực tài liệu thông thường và hỗ trợ bác sĩ trong việc đưa ra quyết định chẩn đoán phức tạp vẫn đáng khuyến khích.

Nghiên cứu này nhấn mạnh tầm quan trọng của việc cân nhắc sự tiến bộ công nghệ với việc tích hợp quy trình làm việc và sự chấp nhận của bác sĩ. Cần tiếp tục phát triển và xác minh các công cụ hỗ trợ chẩn đoán dựa trên AI để hiện thực hóa cam kết của chúng trong việc cải thiện quản lý bệnh lý thần kinh cơ.

Tài liệu tham khảo

Gorenshtein A, Weisblat Y, Khateb M, Kenan G, Tsirkin I, Fayn G, Geller S, Shelly S. Báo cáo EMG dựa trên AI: Một Thử nghiệm Điều khiển Ngẫu nhiên. J Neurol. 2025 Aug 22;272(9):586. doi: 10.1007/s00415-025-13261-3. PMID: 40844612; PMCID: PMC12373542.

Ting DSW, et al. AI cho da liễu: Biên giới tiếp theo của sự đổi mới? Lancet Digit Health. 2020;2(12):e632-e635.

Shamseer L, et al. CONSORT 2010 giải thích và làm rõ: Hướng dẫn cập nhật cho việc báo cáo các thử nghiệm ngẫu nhiên song song. BMJ. 2010;340:c869.

Khateb et al. Trí tuệ nhân tạo trong thần kinh học: Hứa hẹn và khó khăn. Front Neurol. 2023;14:1007001.

Comments

No comments yet. Why don’t you start the discussion?

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *