ハイライト
- AIデジタル病理学(DP)は、特に早期線維症(F0-F2)のMASHにおける病理医間の合意を大幅に改善します。
- 二次調和発生/2光子励起蛍光(SHG/TPEF)イメージングとAI定量線維症(qFibrosis)の組み合わせにより、線維症の重症度の可視化と客観的な評価が向上します。
- AI支援により、臨床試験の参加/除外基準の合意と線維症反応の評価が向上し、裁定の必要性が減少し、試験の力が増加する可能性があります。
研究背景と疾患負荷
代謝機能障害関連脂肪性肝炎(MASH)、以前は非アルコール性脂肪性肝炎(NASH)と呼ばれていましたが、世界中で慢性肝臓病の主な原因となっています。MASHは、肝脂質沈着症、炎症、および異なる程度の線維症を特徴とし、肥満、インスリン抵抗性、および代謝症候群の合併症と強く関連しています。線維症ステージは、MASHにおける不良な臨床結果の最も重要な組織学的予測因子であり、予後と治療決定に影響を与えます。
肝臓生検による肝線維症の正確な評価は、依然として臨床的な金標準ですが、線維症ステージングにおける病理医間の大きな変動が、臨床試験の患者選択を複雑にし、治療効果の評価を混乱させています。特に、試験参加に重要な早期線維症ステージでの観察者間の変動は、患者の不一貫した登録と試験の統計的検出力の低下につながる可能性があります。
AIを組み込んだ新興デジタル病理学プラットフォームは、量的で再現性の高い線維症評価ツールを提供することで、病理医の評価を補完することを目指しています。本研究では、SHG/TPEFイメージングとAI駆動の定量線維症測定を用いたAIデジタル病理学システムを評価し、MASH生検における線維症ステージングの信頼性を向上させることが目的でした。
研究デザイン
本研究では、NCT03517540およびNCT03912532で登録された2つの第II/III相臨床試験から得られた120枚のデジタル化された肝臓組織学スライドを分析しました。4人の専門肝臓病理医が、AI支援あり・なしでこれらのスライドの線維症ステージを独立して評価しました。ランダム化された2期間クロスオーバーデザインを用いて、学習や疲労の影響を制御しました。
AIデジタル病理学プラットフォームは、コラーゲン繊維の高コントラスト可視化を可能にする無標識モダリティである未染色SHG/TPEFイメージングを活用しました。これに加えて、AI派生の定量線維症指標(qFibrosis)が組み込まれ、カテゴリカルなステージング出力とともに連続的な線維症評価を提供し、病理医のスコアリングを支援しました。
主要エンドポイントには、Cohenのkappa値で評価された病理医間および病理医内での合意の変化が含まれました。二次解析では、試験参加/除外基準(F2-F3の線維症ステージで参加;F0/F1/F4で除外)と治療による線維症反応の評価に関する合意が評価されました。
主要な知見
AI支援は、特に伝統的に変動が大きかった早期線維症ステージ(F0-F2)で、病理医間の合意を大幅に改善しました。AI支援により、観察者間のkappa値が約0.4から0.7に上昇し、大幅な改善を示しました。線維症ステージの中央値呼び出しのばらつきも、AI支援により著しく減少しました。
注目に値する点として、AI支援は病理医内の一貫性を変えることはなく、個々の病理医の信頼性はAIの援助に関わらず安定していたことを示唆しています。
臨床試験の症例分類に関しては、AIなしで45%だった参加症例(F2-F3)の合意がAIありで71%に上昇し、除外症例の合意は38%から55%に向上しました。同様に、治療による線維症反応の評価の合意も49%から61%に上昇しました。
病理医は、AIプラットフォームの各コンポーネントの有用性を次のように評価しました:SHG/TPEF画像は83%の症例で有用とされ、qFibrosis連続値は55%、qFibrosisステージは38%で有用とされました。これは、可視化の向上と定量指標の価値を強調しています。
これらの改善を臨床試験の文脈でモデル化すると、裁定プロセスの必要性が約25%減少し、統計的検出力が最大45%向上する可能性があることが示されました。これにより、より小さなサンプルサイズや効率的な試験設計が可能になります。
専門家のコメント
AIを用いたデジタル病理学は、MASHの線維症ステージングにおける主観的な変動を低減することで、臨床研究の重要な未充足ニーズに対処します。SHG/TPEFイメージングとAI定量評価の組み合わせは、特に検出が困難な早期および中間期の線維症の客観性と再現性を向上させます。
病理医内の信頼性は変わらなかったものの、病理医間の合意の向上は、臨床試験の堅牢性を直接改善し、患者の適格性判定と治療反応評価を均一化します。この技術的補完は、より精密な組織学的エンドポイントを通じて、薬剤開発のタイムラインを加速し、関連コストを削減する可能性があります。
有望な結果にもかかわらず、限界としては、専門肝臓病理医に限定された研究であることから、一般病理医や地域の設定には一般的ではない可能性があります。より大規模なコホートや実世界の設定、多様な病理医の専門知識を含む前向き検証が、広範な導入のために不可欠です。さらに、他の非侵襲的な線維症マーカーや臨床パラメータとの統合により、診断ワークフローを最適化することができます。
結論
AI支援デジタル病理学、特にSHG/TPEFイメージングとAI派生の定量線維症指標を用いることで、MASHの線維症ステージングにおける病理医間の合意が大幅に向上します。この改善は、特に臨床試験の適格性判定と疾患監視に重要な早期線維症ステージで顕著です。合意の向上により、裁定の負担が軽減され、臨床試験の力が向上し、臨床研究の効率と治療評価の有意な進歩をもたらします。
今後の研究は、専門センターを超えたアクセスの拡大や、ルーチンの病理学実践へのプラットフォームの統合を含め、前向き多施設研究でのAIツールの検証に焦点を当てるべきです。これにより、患者ケアの向上とMASHにおける治療発見の加速が期待されます。
参考文献
1. Abdurrachim D, Lek S, Ong CZL, et al. Utility of AI digital pathology as an aid for pathologists scoring fibrosis in MASH. J Hepatol. 2025 May;82(5):898-908. doi:10.1016/j.jhep.2024.11.032.
2. Dulai PS, Singh S, Patel J, et al. Increased risk of mortality by fibrosis stage in nonalcoholic fatty liver disease: Systematic review and meta-analysis. Hepatology. 2017;65(5):1557-1565.
3. Kalia HS, Gaglio PJ, Hooker CA, et al. Histological agreement of NASH fibrosis among pathologists in clinical practice. Mod Pathol. 2020;33(7):1418-1426.
4. Liu Y, Guo J, Chen Y, et al. Use of second harmonic generation microscopy for collagen assessment in liver fibrosis. Biosensors (Basel). 2021;11(5):162.