AIアシスタントが分子に基づく中枢神経系腫瘍分類で高精度を達成:多施設検証

AIアシスタントが分子に基づく中枢神経系腫瘍分類で高精度を達成:多施設検証

ハイライト

  • Neuropath-AIは、96%のサンプルで家族レベルの分類、87%のテストコホートで終端レベルの予測を達成しました。
  • モデルは、DNAメチル化参照ラベルと比較して、特定のCNS腫瘍タイプに対するトップ1精度が80%、トップ2精度が86%を達成しました。
  • 本研究は、深層学習が標準的な組織病理学全体スライド画像から複雑な分子特徴を直接推定できることを示しています。
  • この技術は、世界中のCNS腫瘍診断の効率と精度を向上させる拡張可能で臨床的に適用可能なアシスタントを提供します。

組織学と分子診断のギャップを埋める

2021年の世界保健機関(WHO)による中枢神経系(CNS)腫瘍の分類は、純粋に形態学的な評価から分子特性に大きく依存した統合的なアプローチへの診断パラダイムの根本的な変化をもたらしました。DNAメチル化プロファイリングは現在、分子分類の金標準ですが、その臨床的有用性は高コスト、長いターンアラウンド時間、専門的なインフラストラクチャの必要性により制限されることがよくあります。これにより、世界の神経腫瘍学ケアにおいて「分子的ギャップ」が生じています。

これを解決するために、研究者は人工知能に注目しています。深層学習とコンピュータビジョンを利用して、標準的なヘマトキシリン・エオシン(H&E)染色スライドから直接染色体異常、突然変異、メチル化パターンなどの分子特徴を推定することが可能になりました。本研究では、分子テストの精度を持つが、日常の組織学と同じ速度とアクセス性を持つ階層的な分子推論ベースのシステムNeuropath-AIを評価しています。

研究設計と方法論

この多施設、後向き研究では、研究者が大規模な全スライド画像(WSI)データセットを使用してNeuropath-AIを開発および検証しました。訓練フェーズでは、国立癌研究所(NCI)、小児脳腫瘍ネットワーク(CBTN)、デジタル脳腫瘍アトラスから5,835のサンプルが使用されました。モデルは、臨床実践で遭遇する主要なグリオーマ、胚細胞腫瘍、髄膜または中胚葉腫瘍の52種類の腫瘍タイプを識別するように訓練されました。

テストコホート

モデルの性能は、2024年から2025年にかけて4つの主要な施設(NCI、Northwestern Medicine、ピッツバーグ大学メディカルセンター、ロンドン大学)で同定された5,516のサンプルからなる別のコホートで厳密にテストされました。コホートは性別でバランスが取れており(女性50%、男性50%)、中央値年齢は43歳でした。すべての診断の基準はDNAメチル化に基づいた分類であり、最高レベルの真実度の正確さを確保していました。

統計的評価指標

主要な目的は、広範囲の「家族」レベル(例:グリオーマ対胚細胞)と具体的な「終端」分類の2つのレベルでの分類精度を測定することでした。主要評価項目には、信頼閾値を超える予測を受け取るサンプルの割合(カバレッジ)と、希少な腫瘍タイプの存在を考慮したバランスの取れた精度が含まれました。

主な結果:高精度と臨床カバレッジ

検証研究の結果は、Neuropath-AIの診断補助としての可能性を強調しています。モデルは高カバレッジを示し、5,516のサンプルの96%で家族レベルの分類に成功しました。中程度以上の信頼性で終端レベルの分類に押し進められた場合、モデルはコホートの87%に予測を提供しました。

予測性能

信頼閾値を超える終端分類を満たす4,772のサンプルのうち、最も高いスコアの予測(トップ1)は、DNAメチル化参照ラベルと一致したケースが80%(3,817サンプル;95%信頼区間79-81)でした。すべての52カテゴリにわたる性能をサンプル頻度に関係なく反映するバランスの取れた精度は66%(95%信頼区間63-70)でした。

トップ2の予測を考慮すると、精度は86%(4,103サンプル;95%信頼区間85-87)に上昇し、バランスの取れた精度は75%でした。これらの数値は、AIアシスタントが多くの場合、正解の腫瘍タイプを即座に特定するか、またはトップ2の鑑別診断に含めるという強力なセーフティネットを病理学者に提供することを示唆しています。

専門家コメント:臨床的意義

Neuropath-AIが形態学から分子特性を推定できる能力は、重要な技術的マイルストーンです。これは、DNAメチル化プロファイリングの金標準を置き換えるものではありませんが、迅速なスクリーニングツールとして機能します。分子検査が利用できない環境では、以前に不可能だった診断の深さを提供します。リソース豊富な環境では、さらなる検査の優先順位付け、人間の誤りのフラグ付け、統合診断までの時間を大幅に短縮することができます。

本研究の1つの制限は、後向き性にあります。大規模な多施設コホートが堅固な証拠を提供していますが、前向き研究が必要です。さらに、バランスの取れた精度66%は、一般的な腫瘍が非常に高い精度で識別される一方で、希少なサブタイプはAIにとっても人間の専門家にとっても課題であることを示しています。

結論

Neuropath-AIシステムは、精密な神経腫瘍学の民主化に向けて大きな一歩を踏み出しています。標準的な組織学スライドから分子レベルの洞察を提供することで、診断の精度と効率を向上させる道を切り開いています。モデルが公開され、将来の前向き試験での実装が進むにつれ、病理学者の役割は手動の観察者からAI駆動データの高レベルの統合者へと再定義されることでしょう。

資金提供と参考文献

本研究は、国立衛生研究所(NIH)の内部研究プログラムによって資金提供されました。

参考文献: Lalchungnunga H, Dampier CH, Singh O, et al. 分子推論に基づく階層的深層学習システムのCNS腫瘍診断における分類精度:多施設後向き研究. Lancet Oncol. 2026年2月;27(2):243-253. doi: 10.1016/S1470-2045(25)00661-8. PMID: 41643698.

AI Assistant Achieves High Accuracy in Molecular-Based CNS Tumor Classification: A Multi-Institutional Validation

AI Assistant Achieves High Accuracy in Molecular-Based CNS Tumor Classification: A Multi-Institutional Validation

Highlight

  • Neuropath-AI reached family-level classifications in 96% of samples and terminal-level predictions in 87% of the test cohort.
  • The model achieved a Top-1 accuracy of 80% and a Top-2 accuracy of 86% for specific CNS tumor types compared to DNA methylation reference labels.
  • The study demonstrates that deep learning can successfully infer complex molecular features directly from standard histopathological whole-slide images.
  • This technology provides a scalable, clinically applicable assistant to improve the efficiency and accuracy of CNS tumor diagnosis worldwide.

Bridging the Gap Between Histology and Molecular Diagnostics

The 2021 World Health Organization (WHO) classification of central nervous system (CNS) tumors has fundamentally shifted the diagnostic paradigm from purely morphological assessment to an integrated approach that heavily relies on molecular characteristics. While DNA methylation profiling is currently the gold standard for molecular classification, its clinical utility is often limited by high costs, long turnaround times, and the requirement for specialized infrastructure. This creates a significant “molecular gap” in global neuro-oncology care.

To address this, researchers have turned to artificial intelligence. By leveraging deep learning and computer vision, it is now possible to infer molecular features—such as chromosomal alterations, mutations, and methylation patterns—directly from standard hematoxylin and eosin (H&E) stained slides. This study evaluates Neuropath-AI, a hierarchical molecular inference-based system designed to classify CNS tumors with the precision of molecular testing but the speed and accessibility of routine histology.

Study Design and Methodology

In this multi-institutional, retrospective study, researchers developed and validated Neuropath-AI using a massive dataset of whole-slide images (WSIs). The training phase involved 5,835 samples from the National Cancer Institute (NCI), the Children’s Brain Tumor Network (CBTN), and the Digital Brain Tumour Atlas. The model was trained to identify 52 distinct tumor types, encompassing the majority of gliomas, embryonal tumors, and meningeal or mesenchymal tumors encountered in clinical practice.

The Test Cohort

The model’s performance was rigorously tested on a separate cohort of 5,516 samples identified between 2024 and 2025 across four major centers: the NCI, Northwestern Medicine, the University of Pittsburgh Medical Center, and University College London. The cohort was balanced by sex (50% female, 50% male) with a median age of 43 years. The reference standard for all diagnoses was DNA methylation-based classification, ensuring the highest level of ground-truth accuracy.

Statistical Endpoints

The primary objectives were to measure classification accuracy at two levels: the broad “family” level (e.g., glioma vs. embryonal) and the specific “terminal” classification. Coprimary endpoints included sample coverage (the percentage of samples receiving a prediction above a confidence threshold) and balanced accuracy, which accounts for the rarity of certain tumor types.

Key Findings: High Accuracy and Clinical Coverage

The results of the validation study underscore the potential of Neuropath-AI as a diagnostic adjunct. The model demonstrated high coverage, successfully reaching a family-level classification in 96% of the 5,516 samples. When pushed to terminal-level classification with at least moderate confidence, the model provided predictions for 87% of the cohort.

Prediction Performance

Among the 4,772 samples that met the confidence threshold for terminal classification, the single highest-scoring prediction (Top-1) matched the DNA methylation reference label in 80% of cases (3,817 samples; 95% CI 79–81). The balanced accuracy, which reflects performance across all 52 categories regardless of sample frequency, was 66% (95% CI 63–70).

When considering the Top-2 predictions, the accuracy rose to 86% (4,103 samples; 95% CI 85–87), with a balanced accuracy of 75%. These figures suggest that in the vast majority of cases, the AI assistant either identifies the correct tumor type immediately or places it within the top two differential diagnoses, providing a powerful safety net for pathologists.

Expert Commentary: Clinical Implications

The ability of Neuropath-AI to infer molecular properties from morphology is a significant technological milestone. While it does not replace the gold-standard DNA methylation profiling, it serves as a rapid screening tool. In settings where molecular testing is unavailable, it provides a level of diagnostic depth that was previously impossible. In high-resource settings, it can prioritize cases for further testing, flag potential human errors, and drastically reduce the time to an integrated diagnosis.

One limitation of the study is its retrospective nature. While the large, multi-institutional cohort provides robust evidence, prospective studies are needed to evaluate how the model performs in real-time clinical workflows. Furthermore, the balanced accuracy of 66% indicates that while common tumors are identified with very high precision, rarer subtypes remain a challenge for AI, much as they do for human experts.

Conclusion

The Neuropath-AI system represents a major step toward the democratization of precision neuro-oncology. By providing molecular-level insights from standard histology slides, it offers a pathway to improve diagnostic accuracy and efficiency. As the model becomes publicly available, its implementation in future prospective trials will likely redefine the role of the pathologist from a manual observer to a high-level integrator of AI-driven data.

Funding and Reference

This study was funded by the Intramural Research Program of the National Institutes of Health (NIH).

Reference: Lalchungnunga H, Dampier CH, Singh O, et al. Classification accuracy of a hierarchical molecular inference-based deep-learning system for CNS tumour diagnosis: a multi-institutional, retrospective study. Lancet Oncol. 2026 Feb;27(2):243-253. doi: 10.1016/S1470-2045(25)00661-8. PMID: 41643698.

Comments

No comments yet. Why don’t you start the discussion?

コメントを残す