はじめに
代謝機能障害関連性脂肪性肝炎(MASH)は、新規の代謝機能障害関連性脂肪性肝疾患(MASLD)のスペクトラム内に位置づけられ、肥満や2型糖尿病を持つ成人における肝疾患関連の合併症の主要な原因となっています。肝生検の組織学的評価——ネクロ炎症活動度のグレーディングと線維化のステージング——は、患者選択と主なエンドポイントの金標準であり、多くの治療臨床試験で使用されています。しかし、病理学者が核心的な組織学的特徴(特に肝細胞の球状変性、小葉炎症、線維化の分布)を定義し、スコアリングする方法のばらつきが大きな問題を引き起こしています:高頻度の観察者間および観察者内ばらつき、一貫性のない試験登録(スクリーニング失敗)、プラシーボ反応率のばらつきが治療効果を隠してしまう可能性があります。
これらの問題に対処するために、国際MASLD病理グループ(IMPG)は25人の専門肝臓病理学者と統計学者からなるパネルが、MASH臨床試験向けの組織学的定義、標本処理、スコアリングの使用、読影ワークフローの標準化についてのコンセンサスポジションステートメントを開発しました。彼らの作業は、J Hepatol(Lackner et al., 2025)に掲載され、多段階デルファイプロセスを使用して、再現性を向上させ、多施設試験を円滑に進め、機械学習用の高品質な注釈付きデータセットの生成を支援することを目指した堅牢な一連の推奨事項に達しました。
新しいガイドラインのハイライト
IMPGコンセンサスの主な取り組み:
– 生検の処理、染色、報告の厳密で標準化されたアプローチにより、ばらつきが減少し、試験の信頼性が向上します。
– 核心的な組織学的特徴(脂肪変性、球状変性、小葉および門脈炎症、Mallory-Denk体、線維化パターン)の明確な操作的定義が承認され、病理学者間の解釈のズレが軽減されます。
– 現在使用されているスコアリングシステム(NASH Clinical Research Network [NASH-CRN] および SAF/FLIP)の一貫した適用方法と、それらを試験エンドポイントに合わせる方法に関するガイダンスが提供されます。
– 中央読影のパラダイム(独立した2人の盲検読影者と裁定)、事前定義されたトレーニング/校正、継続的な品質管理が強調されています。
– AI対応のためのステートメント:標準化されたラベル、デジタル化基準、注釈規則、メタデータが指定され、再現可能な監視学習が可能になります。
デルファイプロセスの重要な数値結果:IMPG WGsは278の主要なステートメントを生成しました。第1ラウンドでは162のステートメントが80%以上の合意を得ました。改訂と議論の後、第2ラウンドでは192の最終ステートメントが80%以上の合意を得ました。
更新された推奨事項と主な変更点
IMPGステートメントは、MASLDの管理に関する臨床実践ガイドラインの代わりではありませんが、臨床試験向けの標準化された病理手順と定義を提供します。以前の非公式なアプローチと比較して、新しいまたは明確化されたポイントのハイライトは以下の通りです:
– 試験への参加と報告のための明確な最低生検品質指標(標本処理、固定、長さ、門脈径の推奨)。
– 主観的なばらつきを軽減するための組織学的球状変性と小葉炎症の操作的定義。
– 使用する染色(HE染色と結合組織染色)と、免疫組織化学や特殊染色が必要となる場合の明確な推奨。
– 確立されたスコアリングシステム(NASH-CRN NAS、SAF)の標準的な使用方法と、複合エンドポイントの解釈方法に関する詳細な推奨。
– 中央読影ワークフロー、校正演習、裁定の適合閾値に関する詳細な推奨。
– AI互換データセットの生成フレームワーク:スライドデジタル化基準、注釈の粒度、必要なメタデータフィールド。
これらのコンセンサス推奨事項は、初期の基盤となるスコアリングシステム(Kleiner et al. 2005 NASH-CRN;Bedossa et al. 2012 SAF)と、主要学会からの臨床実践ガイドライン(AASLD 2018;EASL 2016)を基に、試験に関連する病理学的標準化と再現性に焦点を当てています。
トピック別の推奨事項
以下は、トピックごとにパネルが承認した実用的な推奨事項です。IMPGがコンセンサス(デルファイ)アプローチを使用した場合は、従来のエビデンスグレードではなく、パネルの合意閾値(80%以上)が示されます。
生検の採取と処理
– 最低品質指標(コンセンサス):可能な限り15〜20 mmのコア長を推奨し、門脈径の数を記録すること。注:試験は、許容される標本長と、閾値未満の場合の再サンプリングまたは除外の計画を事前に定義する必要があります。(80%以上の合意)
– 固定と処理:10%の中性緩衝ホルマリンに即座に配置し、通常のパラフィン埋め込みと全厚切片を使用します。冷蔵アイソタイムと固定時間をメタデータに記録します。(80%以上の合意)
– 染色:必須のHE染色と結合組織染色(Masson三色染色またはSirius Red)。特定のエンドポイント裁定のために必要な追加染色(例:CK8/18、ユビキチン)は、必要に応じてのみ使用します。(80%以上の合意)
組織学的特徴の定義
– 脂肪変性:大胞性脂肪変性を示す肝細胞の割合(標準的な区分:<5%、5〜33%、34〜66%、>66%)でスコアリングし、既存のスコアリングシステムと一致させる。(80%以上の合意)
– 肝細胞の球状変性:サイズの増大、細胞質の希釈、円形の細胞輪郭などの操作的説明をパネルが承認し、訓練セット用の写真顕微鏡画像を提供しました。グループは、球状変性と糖原核またはアーティファクトの区別を強調しました。(80%以上の合意)
– 小葉炎症:200倍視野あたりの炎症巣の数と種類を定義し、計数方法と門脈系炎症との区別に関するガイダンスを提供します。(80%以上の合意)
– Mallory-Denk体とアポトーシス体:存在する場合は明示的に記録し、その存在は試験プロトコルに従って活動スコアに寄与します。(80%以上の合意)
線維化のステージングと報告
– 活動度(グレーディング)と線維化(ステージング)を別々に評価——線維化は活動度スコアとは独立してステージングする必要があります。(80%以上の合意)
– 検証済みの順序尺度を使用:パネルは、検証済みの順序尺度(例:NASH-CRN ステージ 0〜4 または SAF 線維化ステージ)の継続的な使用を推奨し、窦周(ゾーン 3)、門脈、橋渡し、硬変性変化の明確な定義を提供しました。(80%以上の合意)
– パターンとステージの両方を記録(例:「窦周および門脈線維化ステージ 2」)して、メカニズム解釈をサポートします。(80%以上の合意)
スコアリングシステムと試験エンドポイント
– 試験プロトコルは、使用するスコアリングシステム(NASH-CRN または SAF)と、複合エンドポイントの操作化方法(例:「脂肪性肝炎の解決なしの線維化悪化」または「≥1 ステージの線維化改善」)を事前に指定することを推奨します。(80%以上の合意)
– 読影者間でスコアリングシステムを混在させないようにし、事前に指定された相互対応がない場合は避ける。(80%以上の合意)
– 線維化エンドポイントについては、同一の読影者による対照生検の中央再ステージングと、ばらつきを最小限に抑えるための標準的な洗浄期間を要求します。(80%以上の合意)
中央読影、読影者のトレーニング、裁定
– Phase II/III 試験では中央読影を推奨します。推奨モデルは、独立した2人の盲検専門読影者と、不一致が一定の閾値を超えた場合の裁定パス(3人目の読影者またはコンセンサス会議)が事前に設定されたものです。(80%以上の合意)
– 事前のトレーニングセッションを使用して注釈付き訓練スライドを提供し、試験中の一致度モニタリングによる継続的な品質管理を行うことを義務付けます。(80%以上の合意)
– 事前に定義された一致度指標(例:カッパ閾値または一致率)を定義し、一致度が閾値を下回った場合の自動トリガーで再トレーニングまたは裁定を行う。(80%以上の合意)
デジタル化、注釈、AI 対応
– 診断解像度での全スライドイメージングを推奨します。メタデータにはスキャナータイプ、目的物レンズ倍率、ファイル形式を含める必要があります。(80%以上の合意)
– 標準化された注釈規則:脂肪変性、球状変性、炎症、線維化の領域をマークし、可能な限りピクセルレベルと領域レベルのラベルを含めます。(80%以上の合意)
– 透明化されたライセンスでモデル開発と独立検証に利用できるように、匿名化された注釈付きデータセットの共有を奨励します。(80%以上の合意)
特別な状況と注意点
– 大きな破片化、不良な固定、または顕著なアーティファクトがある生検は、事前に定義された品質閾値未満の場合は、主要な有効性分析から除外する必要があります。(80%以上の合意)
– 自己免疫特性、胆汁性パターン、重複症候群などの稀な組織学的パターンについては、追加の臨床相関を推奨し、試験デザインが明示的に許可しない限り、標準の MASH エンドポイントから除外することを推奨します。(80%以上の合意)
専門家のコメントと洞察
IMPG コンセンサスは、経験豊富な肝臓病理学者によって形成され、広範な合意と重要な持続的な論争を反映しています。
強い合意の領域
– 調和された操作的定義は、観察者間のばらつきを実質的に削減し、試験効率を向上させます。
– 多施設試験には、事前に指定されたトレーニング/校正が不可欠な中央読影が必要です。
– AI はますます重要な役割を果たしますが、標準化された高品質のラベル付きデータが必要です。
継続的な議論の領域
– 肝細胞の球状変性を構成する正確な形態学的閾値は、一部のケースでは困難です。写真集と訓練スライドが強調されました。
– 線維化の評価における連続的(定量的)対順序(半定量的)アプローチ:定量的デジタル測定は有望ですが、パネルは規制当局と歴史的な順序段階への依存を認識し、可能な場合は並行アプローチを推奨しました。
– 最小生検長:長いコアはサンプリング誤差を軽減しますが、多施設試験における実用的な制約(患者の耐性、オペレーターの技術)により、厳格な閾値を設定することが難しい場合があります。試験は、許容範囲と不適切なコアの処理を事前に指定する必要があります。
パネルが特定した将来のトレンドには、デジタル病理学の広範な採用、活動度と線維化を量化的に評価する検証済みの画像解析アルゴリズムの開発、AI 検証を加速するための注釈付きデータセットの国際的なプールが含まれます。
医師、スポンサー、病理学者にとっての実用的な意味
試験のスポンサーと研究者
– プロトコルの付録に IMPG の推奨事項を組み込む:生検取得の標準作業手順、中央読影ワークフロー、校正計画、生検品質の閾値。
– 標準化された標本処理と中央読影を使用することで、組織学的不一致によるスクリーニング失敗が減少すると予想されます。
病理学者と中央読影者
– 校正演習に参加し、IMPG の写真例と注釈規則を使用して解釈を合わせます。
– 標本の十分性と技術的アーティファクトを明示的に記録して報告します。これらは規制エンドポイントにとって重要です。
患者を登録する診療所
– 臨床介入者と協力して、十分なコア(長さ、固定プロトコル)の優先取得と、試験参加のための迅速な処理とメタデータの取得を確保します。
患者の事例(例示的)
ジョンは、肥満と2型糖尿病のある52歳男性で、Phase 3 MASH 試験のスクリーニングに同意しました。皮膚穿刺肝生検が行われ、18 mm の長さで測定され、速やかに固定され、オペレーターのメタデータと共に提出されました。2人の盲検病理学者(試験訓練セットで校正)による中央読影では、脂肪変性 34〜66%(スコア 2)、明らかな球状変性(スコア 1)、小葉炎症 2 窠/200 倍(スコア 1)、NAS = 4、線維化ステージ 2 窦周および門脈と報告されました。試験の事前に定義された参加要件は NAS ≥4 および線維化ステージ 2〜3 であるため、ジョンは登録されました。52 週後の対照生検は同じ SOP に従って処理され、同じ読影者によって読影され、最大限の比較可能性を確保しました。
参考文献
1. Lackner C, Gouw ASH, Alves V, et al. Consensus position statements for the standardized application of histological grading and staging systems in MASH clinical trials. J Hepatol. 2025 Oct 8. doi:10.1016/j.jhep.2025.09.019. (Epub ahead of print)
2. Kleiner DE, Brunt EM, Van Natta M, et al. Design and validation of a histological scoring system for nonalcoholic fatty liver disease. Hepatology. 2005;41(6):1313–1321.
3. Bedossa P, Poitou C, Veyrie N, et al. Histopathological algorithm and scoring system for evaluation of liver lesions in patients with NAFLD. Hepatology. 2012;56(5):1751–1760.
4. Chalasani N, Younossi Z, Lavine JE, et al. The diagnosis and management of nonalcoholic fatty liver disease: Practice guidance from the American Association for the Study of Liver Diseases. Hepatology. 2018;67(1):328–357.
5. European Association for the Study of the Liver (EASL), European Association for the Study of Diabetes (EASD), European Association for the Study of Obesity (EASO). EASL–EASD–EASO Clinical Practice Guidelines for the management of non-alcoholic fatty liver disease. J Hepatol. 2016;64(6):1388–1402.
おわりに
IMPG コンセンサスステートメントは、MASH 臨床試験における厳密で再現性の高い組織学的エンドポイントに向けて大きな一歩です。標本処理の標準化、定義の調和、中央読影ワークフローの最適化、AI 対応の注釈フレームワークの提供により、これらの推奨事項はばらつきを削減し、試験信号検出を改善し、MASLD/MASH 用の信頼性の高い薬剤開発を加速させるはずです。

