ハイライト
– 全面的な叙述的レビュー(2020年-2025年)で1,422件の論文をスクリーニングし、327件の元の深層学習(DL)研究を合成しました。これらの研究は、検出/診断(55%)、セグメンテーション(28%)、予測/予後(5%)、新規応用(12%)に分類されました。
– 概念実証のDLモデルはしばしば専門家と同等の診断精度(例:鼻咽頭がん検出92%、喉頭悪性腫瘍86%、耳科疾患>95%)を達成しましたが、予後に関する研究や多施設での前向き検証は依然として少ないです。
– 主要な実装促進要因には、調和された多施設データセット、標準化された取得プロトコル、プライバシー保護型モデル訓練のための連邦学習、解釈可能なモデル、人間参加型ワークフローでの前向き臨床評価が含まれます。
背景
耳鼻咽喉科は、内視鏡視覚化(鼻咽頭、喉頭)、顕微鏡下耳科評価、画像診断、生理信号解析(聴力検査、平衡機能検査)など、広範な診断・治療タスクを含んでいます。これらの多くのタスクは画像または信号駆動であり、したがって、生データから階層的な特徴を学習する人工知能(AI)のサブセットである深層学習(DL)に適しています。頭頸部がんの晩期発見、慢性中耳炎、難聴、専門家の専門知識へのアクセスの不均等といった臨床的な負担は、診断精度、トリアージ、手術中の意思決定支援、個別化デバイス最適化を改善するアルゴリズム補助への関心を高めています。
研究デザイン(レビュー範囲と方法)
Noviらによる叙述的レビュー(JAMA Otolaryngol Head Neck Surg. 2025)は、2020年から2025年にかけて英語で発表された文献をスクリーニングし、耳鼻咽喉科に適用された327件の元のDL研究を含めました。これらの研究は、検出と診断(179件の研究)、予測と予後(16件の研究)、画像セグメンテーション(93件の研究)、新規応用(39件の研究)に分類されました。含まれる文献は、概念実証の後ろ向きモデル開発と内部検証研究を主とし、比較的少ない多施設データセットや前向き臨床試験が含まれています。
主要な知見と結果
全体像
耳鼻咽喉科におけるDLは、内視鏡画像解釈(鼻咽頭、喉頭、副鼻腔)、耳科画像と鼓膜解析、CT/MRI上の腫瘍検出/セグメンテーション、聴覚デバイスの生理信号最適化など、複数のサブドメインにわたって増殖しています。多くの研究は分類タスク(モデルは病気を検出できるか?)に焦点を当てており、その後にセグメンテーション(解剖構造や病変の輪郭を描画)と、少数の予後予測(生存率、再発)やリアルタイムの手術中支援(器具追跡、ランドマーク識別)に焦点を当てた研究が続きます。
検出と診断パフォーマンス
179件の検出に焦点を当てた研究の多くは、専門家と同等か、いくつかのタスクではそれ以上のパフォーマンス指標(精度、感度、特異度、ROC曲線下面積)を報告しています。レビューからの代表的な報告値は以下の通りです:
- 鼻咽頭がん検出:選択的な画像ベースモデルで約92%の精度が報告されています。
- 喉頭悪性腫瘍分類:検証済みデータセットで約86%の精度が報告されています。
- 耳科疾患(例:鼓膜疾患):キュレーションされた画像セットでしばしば95%以上の精度が報告されています。
これらのパフォーマンス指標は、後ろ向きかつしばしば単一施設のデータセットから得られ、内部クロスバリデーションやホールドアウトセットが頻繁に使用されていました。地理的に異なる集団に対する外部検証は比較的少なかったです。
画像セグメンテーション
93件の研究がセグメンテーションに焦点を当て、気道、副鼻腔、腫瘍境界などの解剖領域を信頼性高く区別し、計画、体積測定、放射線療法ターゲットの区別に有用であることを示しました。セグメンテーションモデルは制御されたデータセットで一貫したパフォーマンス指標(しばしば許容範囲内のDice係数が報告されます)を示し、自動測定やレジストレーションなどの下流タスクをサポートしています。
予測と予後
予後応用は比較的限られていました(16件の研究)が有望でした。例としては、口腔咽頭がんの生存期間層別化や慢性副鼻腔炎の再発予測があります。これらの研究はしばしば画像特徴と臨床メタデータを組み合わせて予測力を向上させました。しかし、研究の数が少なく、エンドポイントが異質であるため、臨床的な有用性について決定的な結論を導き出すのは困難です。
新規手術中応用とデバイス最適化
レビューで強調された新規用途には、リアルタイムの手術器具追跡、手術中のランドマーク識別(最小侵襲性頭蓋底手術や内視鏡副鼻腔手術に有用)、人工内耳マッピングや補聴器の個人化のための最適化アルゴリズムが含まれます。これらの応用は低遅延推論と人間-機械インターフェースを重視していますが、初期の実現可能性のデモンストレーションを超えたものは少ないです。
方法論的観察
一般的な方法論的なテーマには、注釈付きデータセットに依存した教師あり学習、データセットの人口統計学的情報やラベリングプロトコルの報告のばらつき、クラスの不均衡、限られた外部テスト、信頼区間や校正指標の報告の不揃いさが含まれます。説明可能性手法(サリエンシーマップ、注意可視化)はいくつかの研究で使用されましたが、臨床医ユーザーとの厳密な評価は稀でした。
専門家コメント:長所、制限、注意点
長所:集積された研究は、DLが耳鼻咽喉科の内視鏡画像、画像診断、生理信号から臨床的に重要なパターンを抽出できることを示しています。高品質の注釈付きデータセットが存在する場合、モデルはしばしば専門家に近い性能を達成し、ワークフローを効率化する再現可能なセグメンテーションを提供します。
制限と重要な注意点:
- データセットの代表性和バイアス:多くのデータセットは単一施設、陽性症例の多いもの、または社会人口学的多様性が欠けています。スペクトルバイアスのリスクと一般化可能性の低下が高いです。
- 外部と前向き検証:多施設の外部検証や患者中心のアウトカム(診断遅延の回避、治療方針の変更、危害軽減)を測定する前向き影響分析を報告する研究は少ないです。
- 解釈可能性と臨床医の信頼:事後可視化(例:ヒートマップ)は役立ちますが、十分ではありません。臨床医は理由、不確実性の量、明確な失敗モードを提供する透明なモデルを必要とします。
- 規制と統合の障壁:実世界での展開には、画像取得の標準化、データ管理、HIPAA準拠のアーキテクチャ、アルゴリズム更新に対応する規制承認が必要です。
- 運用上の考慮事項:遅延、ユーザーインターフェース設計、既存の電子健康記録や手術ワークフローへの統合はしばしば考慮されていません。
臨床採用への道筋:実践的な推奨事項
概念実証から日常的な臨床ツールへ移行するために、分野は以下を優先すべきです:
- 高品質な多施設データセット:共有された、よく注釈付けされたデータセットは、標準化された取得プロトコルと明確なラベルを持つことで、堅牢な訓練と外部検証を可能にします。
- 連邦学習とプライバシー保護型学習:連邦学習はサンプルの多様性を増やし、患者のプライバシーと機関のデータ管理を保つことができます。
- 標準化された報告と前向き検証:確立されたAI報告フレームワークの採用と、診断精度、ワークフロー効率、患者アウトカムを測定する前向き、理想的には無作為化された臨床影響研究。
- 解釈可能性と不確実性の量:モデルは具体的な説明と調整された確率を提供すべきです。人間参加型システムは、臨床医がアルゴリズム提案をオーバーライドまたは確認できるようにすることができます。
- バイアス軽減と公平性テスト:人種、年齢、性別、デバイスタイプ、画像装置に関するルーチンのサブグループ解析;健康格差の増大を防ぐための対策。
- 多学科協働:臨床医、データサイエンティスト、エンジニア、倫理学者、規制専門家がモデルと展開戦略を共に設計する必要があります。
結論
この叙述的レビューは、加速する文献をまとめ、深層学習が耳鼻咽喉科における画像ベースの診断、セグメンテーション、予後モデリング、手術中支援に真の潜在能力を持っていることを示しています。しかし、多くの出版物はまだ概念実証段階にとどまっており、代表的で多施設のデータセット、透明性のあるモデル、有意義な臨床影響を示す堅牢な前向き検証の緊急な必要性があります。連邦データ戦略、解釈可能性フレームワーク、人間参加型展開を組み合わせた慎重で多学科的なアプローチが、アルゴリズムの可能性を安全で公平な臨床ツールに翻訳するために不可欠です。
資金源とclinicaltrials.gov
レビューに含まれる研究に関連する資金提供声明と試験登録については、原著論文を参照してください:Novi SL, Navarathna N, D’Cruz M, Brooks JR, Maron BA, Isaiah A. Deep Learning in Otolaryngology: A Narrative Review. JAMA Otolaryngol Head Neck Surg. 2025 Nov 13. doi: 10.1001/jamaoto.2025.3911. Epub ahead of print. PMID: 41231484.
参考文献
1. Novi SL, Navarathna N, D’Cruz M, Brooks JR, Maron BA, Isaiah A. Deep Learning in Otolaryngology: A Narrative Review. JAMA Otolaryngol Head Neck Surg. 2025 Nov 13. doi: 10.1001/jamaoto.2025.3911. Epub ahead of print. PMID: 41231484.

