Điểm nổi bật
Nghiên cứu chẩn đoán này đánh giá tính khả thi và độ chính xác của các mô hình máy học (Machine Learning, ML) phân tích đặc trưng âm học từ các cuộc trò chuyện ngắn giữa bệnh nhân và bác sĩ đa khoa để nhận diện suy giảm nhận thức (Cognitive Impairment, CI). Dữ liệu từ hơn 900 bệnh nhân tại hai trung tâm đô thị cho thấy nghiên cứu có khả năng dự đoán tốt với AUROC xấp xỉ 0,73. Các chỉ dấu âm học chính bao gồm cao độ, thời gian và độ biến thiên, hỗ trợ một công cụ sàng lọc thụ động, có khả năng triển khai trên quy mô lớn trong chăm sóc lâm sàng thường quy.
Bối cảnh nghiên cứu
Suy giảm nhận thức, thường bị đánh giá thấp trong chăm sóc ban đầu, đặt ra nhiều thách thức do khởi phát âm thầm và biểu hiện không đồng nhất. Các giai đoạn sớm của suy giảm nhận thức nhẹ và sa sút trí tuệ thường không được nhận diện do quỹ thời gian lâm sàng hạn chế, thiếu công cụ sàng lọc chuẩn hóa và nguồn lực còn hạn chế. Phát hiện sớm CI cho phép can thiệp kịp thời, qua đó có thể cải thiện kết cục của người bệnh và hỗ trợ lập kế hoạch chăm sóc.
Các công cụ sàng lọc truyền thống, như Thang đánh giá nhận thức Montreal (Montreal Cognitive Assessment, MoCA), đòi hỏi thời gian của bác sĩ và sự hợp tác của người bệnh, làm hạn chế khả năng áp dụng rộng rãi. Những tiến bộ trong trí tuệ nhân tạo và xử lý giọng nói mở ra cơ hội mới cho sàng lọc tự động, thụ động. Các nghiên cứu trước đây cho thấy gián đoạn lời nói và thay đổi ngữ điệu có tương quan với suy giảm nhận thức. Nghiên cứu này tận dụng các phương pháp trích xuất đặc trưng âm học tiên tiến và máy học để đánh giá đặc điểm lời nói từ các cuộc trò chuyện lâm sàng thường quy nhằm phát hiện CI.
Thiết kế nghiên cứu
Nghiên cứu chẩn đoán đa trung tâm này được thực hiện từ tháng 8 năm 2020 đến tháng 12 năm 2021 tại các cơ sở chăm sóc ban đầu ở Thành phố New York và Chicago, tuyển chọn bệnh nhân nói tiếng Anh từ 55 tuổi trở lên, chưa từng được chẩn đoán sa sút trí tuệ hoặc suy giảm nhận thức nhẹ. Bản ghi âm các cuộc gặp thường quy giữa bệnh nhân và bác sĩ được thu thập bằng thiết bị di động.
Từ các bản ghi âm, nhiều đoạn խոս nói dài 30 giây được trích xuất để phân tích. Các đặc trưng âm học được suy ra từ cả các mô hình AI nền tảng (Whisper, HuBERT, wav2vec 2.0) và các bộ đặc trưng do chuyên gia xác định, bao gồm eGeMAPS và các tham số ngữ điệu.
Kết cục chính của CI được xác định là điểm số của MoCA thấp hơn ít nhất 1 độ lệch chuẩn so với chuẩn đã hiệu chỉnh theo tuổi và trình độ học vấn. Các bộ phân loại ML được huấn luyện trên các đặc trưng trích xuất để phân biệt bệnh nhân có và không có CI. Các chỉ số hiệu năng bao gồm diện tích dưới đường cong ROC (Area Under the Receiver Operating Characteristic Curve, AUROC) và F1 tối đa (Fmax). Một đoàn hệ xác nhận ngoại bộ từ Chicago được dùng để kiểm tra khả năng khái quát hóa.
Kết quả chính
Nghiên cứu tuyển chọn 787 bệnh nhân ở đoàn hệ chính và 179 bệnh nhân ở đoàn hệ xác nhận ngoại bộ, tổng cộng 966 người tham gia với tuổi trung bình 67,2 tuổi và tỷ lệ hiện mắc suy giảm nhận thức là 21%.
Trong các mô hình đặc trưng âm học, mô hình dựa trên đặc trưng trích xuất từ Whisper đạt độ chính xác dự đoán cao nhất: AUROC 0,733 (KTC 95%, 0,714–0,752) với Fmax 0,502 (KTC 95%, 0,471–0,533) ở đoàn hệ nội bộ, và AUROC 0,727 (KTC 95%, 0,714–0,740) với Fmax 0,459 (KTC 95%, 0,441–0,477) ở đoàn hệ ngoại bộ, cho thấy hiệu năng ổn định giữa các cơ sở.
Phân tích khả năng diễn giải mô hình xác định các đặc trưng âm học chính dự báo CI, bao gồm độ biến thiên cao độ, các bất thường về thời gian và thay đổi ngữ điệu, phù hợp với những thay đổi lời nói đã biết trong suy giảm nhận thức.
Khi được áp dụng như một công cụ sàng lọc trong thực hành, thuật toán đạt độ nhạy 68,2% (KTC 95%, 61,8%–74,6%), độ đặc hiệu 63,6% (KTC 95%, 59,8%–67,4%) và giá trị dự báo dương tính 30,4% (KTC 95%, 28,7%–32,1%) trên đoàn hệ giữ lại. Các chỉ số này gợi ý rằng công cụ có thể xác định hiệu quả những bệnh nhân cần đánh giá nhận thức sâu hơn, đồng thời cân bằng tỷ lệ dương tính giả.
Bình luận của chuyên gia
Nghiên cứu này cho thấy một hướng tiếp cận đầy hứa hẹn và đổi mới nhằm giải quyết khoảng trống quan trọng trong phát hiện suy giảm nhận thức tại chăm sóc ban đầu. Bằng cách tận dụng âm thanh được ghi nhận thường quy và phân tích âm học bằng ML hiện đại, bác sĩ có thể có được một phương pháp sàng lọc người cao tuổi ít tốn nguồn lực trong các lần khám thường ngày mà không cần thêm nhiều công sức của người bệnh hoặc gây gián đoạn đáng kể quy trình làm việc.
Các hạn chế bao gồm việc chỉ tập trung vào bệnh nhân nói tiếng Anh và sử dụng MoCA làm tiêu chuẩn tham chiếu, trong khi bản thân MoCA cũng có những hạn chế. Cần thêm nghiên cứu để đánh giá khả năng áp dụng ở các quần thể đa dạng về ngôn ngữ và văn hóa, đồng thời tinh chỉnh mô hình để cải thiện độ đặc hiệu. Tích hợp với hồ sơ sức khỏe điện tử và hỗ trợ ra quyết định theo thời gian thực có thể tăng cường tính hữu ích.
Các dấu ấn âm học được xác định—cao độ, thời gian, độ biến thiên—là những tương quan sinh học hợp lý của các thay đổi lời nói liên quan đến CI, phản ánh biến đổi trong lập kế hoạch vận động, xử lý ngôn ngữ và chức năng điều hành. Hiểu biết cơ chế này làm tăng mức độ tin cậy đối với cách tiếp cận.
Kết luận
Phân tích âm học thụ động các cuộc trò chuyện giữa bệnh nhân và bác sĩ chăm sóc ban đầu, được xử lý bằng máy học, cung cấp một phương thức khả thi và có thể triển khai trên quy mô lớn để nhận diện suy giảm nhận thức. Với khả năng xác thực tốt trên các đoàn hệ độc lập, cách tiếp cận này có tiềm năng nâng cao phát hiện sớm các rối loạn nhận thức trong chăm sóc ban đầu thường quy, qua đó hỗ trợ chẩn đoán và quản lý kịp thời.
Nghiên cứu tiếp theo nên tập trung mở rộng khả năng áp dụng về mặt ngôn ngữ, tối ưu hóa độ chính xác của mô hình và đánh giá tác động lâm sàng để có thể chuyển giao vào thực hành. Trong khi đó, sàng lọc dựa trên âm học có thể được xem là công cụ bổ trợ cho các đánh giá nhận thức đã được thiết lập, góp phần cải thiện tỷ lệ phát hiện chung và kết cục của người bệnh.
Tài trợ và đăng ký
Thông tin chi tiết của nghiên cứu không nêu rõ nguồn tài trợ hoặc số đăng ký thử nghiệm lâm sàng. Các báo cáo trong tương lai nên làm rõ những nội dung này để bảo đảm tính minh bạch và khả năng tái lập.
Tài liệu tham khảo
1. Nasreddine ZS, Phillips NA, Bédirian V, et al. The Montreal Cognitive Assessment, MoCA: a brief screening tool for mild cognitive impairment. J Am Geriatr Soc. 2005;53(4):695-699.
2. Ybarra O, Burnstein E, Winkielman P, et al. Using tech-based ecological momentary assessments to measure behaviors and emotions in real time: Advantages and challenges. J Med Internet Res. 2018;20(11):e11350.
3. König A, Satt A, Sorin A, et al. Automatic speech analysis for the assessment of patients with predementia and Alzheimer’s disease. Alzheimers Dement (Amst). 2018;10:260-268.
4. Clercq G de, Ghaye T, Degrauwe K, et al. A systematic review on speech analysis for automated detection of cognitive impairment. Geriatrics. 2021;6(1):14.

