Học sâu trong Tai Mũi Họng: Hứa hẹn, Hiệu suất và Đường dẫn đến Sử dụng Lâm sàng

Học sâu trong Tai Mũi Họng: Hứa hẹn, Hiệu suất và Đường dẫn đến Sử dụng Lâm sàng

Nổi bật

– Đánh giá thuật ngữ toàn diện (2020-2025) đã sàng lọc 1.422 bài báo và tổng hợp 327 nghiên cứu gốc về học sâu (DL) trong Tai Mũi Họng, được nhóm thành phát hiện/chẩn đoán (55%), phân đoạn (28%), dự đoán/tiên lượng (5%) và ứng dụng mới nổi (12%).

– Các mô hình DL chứng minh khái niệm thường đạt độ chính xác chẩn đoán tương đương với chuyên gia (ví dụ: phát hiện ung thư vòm họng 92%, ác tính thanh quản 86%, bệnh lý tai >95%), nhưng công việc tiên lượng và xác nhận đa trung tâm triển vọng vẫn còn ít.

– Các yếu tố quan trọng để triển khai bao gồm dữ liệu đa trung tâm hài hòa, giao thức thu thập chuẩn hóa, học liên bang để bảo mật mô hình huấn luyện, mô hình có thể giải thích và đánh giá lâm sàng triển vọng với quy trình làm việc có con người tham gia.

Nền tảng

Tai Mũi Họng bao gồm một tập hợp rộng lớn các nhiệm vụ chẩn đoán và điều trị—nhìn thấy nội soi (vòm họng, thanh quản), đánh giá vi kính tai, diễn giải hình ảnh chẩn đoán và phân tích tín hiệu sinh lý (thính lực, thử nghiệm tiền đình). Nhiều nhiệm vụ này được dẫn dắt bởi hình ảnh hoặc tín hiệu và do đó rất phù hợp với học sâu (DL), một nhánh của trí tuệ nhân tạo (AI) sử dụng mạng nơron nhiều lớp để học các đặc điểm phân cấp từ dữ liệu thô. Gánh nặng lâm sàng—ung thư đầu cổ muộn, viêm tai giữa mạn tính, mất thính lực—và khả năng tiếp cận không đồng đều đối với chuyên gia chuyên môn thúc đẩy sự quan tâm đến các công cụ hỗ trợ thuật toán có thể cải thiện độ chính xác chẩn đoán, phân loại, hỗ trợ quyết định phẫu thuật và tối ưu hóa thiết bị cá nhân.

Thiết kế nghiên cứu (phạm vi và phương pháp đánh giá)

Đánh giá thuật ngữ của Novi et al. (JAMA Otolaryngol Head Neck Surg. 2025) đã sàng lọc các ấn phẩm tiếng Anh từ năm 2020 đến 2025 và bao gồm 327 nghiên cứu gốc về DL áp dụng cho Tai Mũi Họng. Các nghiên cứu được phân loại thành phát hiện và chẩn đoán (179 nghiên cứu), dự đoán và tiên lượng (16 nghiên cứu), phân đoạn hình ảnh (93 nghiên cứu) và ứng dụng mới nổi (39 nghiên cứu). Văn献包括概念验证模型的开发和内部验证研究,多中心数据集或前瞻性临床试验相对较少。

主要发现和结果

总体概况

在耳鼻喉科中,深度学习已扩展到多个子领域:内窥镜图像解释(鼻咽、喉、鼻窦腔)、耳科成像和鼓膜分析、CT/MRI上的放射肿瘤检测/分割以及助听设备的生理信号优化。大多数研究集中在分类任务(模型能否检测疾病?),其次是分割(勾勒解剖结构或病变)和较小数量的先兆预测(生存率、复发)或实时术中辅助(器械跟踪、标志识别)。

检测和诊断性能

在179项以检测为重点的研究中,许多报告了与单个专家表现相当或在某些任务中高于单个专家的表现的性能指标(准确性、敏感性、特异性、ROC曲线下面积)。来自该综述的代表性报告数据包括:

  • 鼻咽癌检测:选定基于图像的模型报告的综合准确率约为92%。
  • 喉部恶性肿瘤分类:在验证数据集中报告的准确率约为86%。
  • 耳科病理(如鼓膜疾病):在精选图像集中报告的准确率通常>95%。

这些性能数据通常来源于回顾性的、通常是单中心的数据集,经常使用内部交叉验证或保留集;对地理上不同的队列进行外部验证的情况较少见。

图像分割

有93项研究涉及分割,可靠地描绘了解剖区域(气道、副鼻窦、肿瘤边界),并在规划、体积测量和放射治疗靶区定义方面展示了实用性。分割模型在受控数据集中表现出一致的性能指标(经常报告的Dice系数在可接受范围内),支持自动测量和配准等下游任务。

预测和先兆

先兆应用相对有限(16项研究)但前景广阔。例子包括口咽癌的生存分层和慢性鼻窦炎的复发预测。这些研究通常结合影像特征与临床元数据以增强预测能力。然而,研究数量少和终点异质性限制了关于临床实用性的明确结论。

新兴术中和设备优化应用

综述强调的新兴用途包括实时手术器械跟踪、术中标志识别(适用于微创颅底和内窥镜鼻窦手术)以及耳蜗植入映射和助听器个性化优化算法。这些应用强调低延迟推理和人机界面,但很少有进展超出早期可行性演示。

方法学观察

常见的方法学主题包括对带注释数据集的监督学习的依赖、数据集人口统计和标记协议的报告不一、类别不平衡、外部测试有限以及置信区间或校准度量报告不一致。一些研究采用了可解释性方法(显著图、注意力可视化),但很少对临床最终用户进行严格评估。

专家评论:优势、局限性和注意事项

优势:集体工作表明,深度学习可以从耳鼻喉科的内窥镜图像、放射学和生理信号中提取临床上相关的模式。在高质量注释数据集存在的情况下,模型通常达到接近专科医生的表现,并提供可重复的分割,可能简化工作流程。

局限性和关键注意事项:

  • 数据集的代表性及偏差:许多数据集是单中心的,富含阳性病例,或缺乏社会人口多样性。谱系偏差和泛化能力降低的风险很高。
  • 外部和前瞻性验证:少数研究报告了多中心外部验证或前瞻性影响分析,这些分析衡量以患者为中心的结果(避免诊断延误、改变治疗决策、减少伤害)。
  • 可解释性和医生信任:事后可视化(如热图)是有帮助的,但不足以满足需求。医生需要透明的模型,提供推理、不确定性量化和明确的失败模式。
  • 监管和集成障碍:实际部署需要强大的图像采集标准化管道、数据治理、符合HIPAA的架构以及考虑算法更新的监管许可。
  • 操作考虑:延迟、用户界面设计以及与现有电子健康记录和操作流程的集成经常被忽视。

临床采用路径:实用建议

为了从概念验证转变为常规临床工具,该领域应优先考虑:

  • 高质量、多机构数据集:共享、注释良好的数据集,具有标准化的采集协议和清晰的标签,可以实现稳健的训练和外部验证。
  • 联邦和隐私保护学习:联邦学习可以在保持患者隐私和机构数据控制的同时增加样本多样性。
  • 标准化报告和前瞻性验证:采用既定的人工智能报告框架和前瞻性、理想情况下随机的临床影响研究,衡量诊断准确性、工作流程效率和患者结果。
  • 可解释性和不确定性量化:模型应提供可操作的解释和校准的概率;有人在环系统可以让医生覆盖或确认算法建议。
  • 偏差缓解和公平测试:针对种族、年龄、性别、设备类型和成像设备进行常规亚组分析;采取缓解策略以防止健康差距扩大。
  • 跨学科合作:医生、数据科学家、工程师、伦理学家和监管专家必须共同设计模型和部署策略。

结论

该综述综合了加速发展的文献,显示深度学习在基于图像的诊断、分割、预后建模和术中支持方面在耳鼻喉科具有真正的潜力。然而,大多数已发表的工作仍处于概念验证阶段,迫切需要具有代表性的、多机构的数据集、透明的模型以及严格的前瞻性验证,以证明有意义的临床影响。一种审慎的、跨学科的方法——结合联邦数据策略、可解释性框架和有人在环部署——将是将算法潜力转化为安全、公平的临床工具的关键。

资金和clinicaltrials.gov

有关综述中包含的研究的资金声明和试验注册,请参阅原始文章:Novi SL, Navarathna N, D’Cruz M, Brooks JR, Maron BA, Isaiah A. 深度学习在耳鼻喉科的应用:一篇叙述性综述。JAMA Otolaryngol Head Neck Surg. 2025年11月13日。doi: 10.1001/jamaoto.2025.3911. Epub提前出版。PMID: 41231484。

参考文献

1. Novi SL, Navarathna N, D’Cruz M, Brooks JR, Maron BA, Isaiah A. 深度学习在耳鼻喉科的应用:一篇叙述性综述。JAMA Otolaryngol Head Neck Surg. 2025年11月13日。doi: 10.1001/jamaoto.2025.3911. Epub提前出版。PMID: 41231484。

Comments

No comments yet. Why don’t you start the discussion?

Để lại một bình luận