ハイライト
• PREVENT試験の70件の回腸大腸内視鏡動画の中央読影解析では、新終末回腸部におけるルッゲルツスコアと変形ルッゲルツスコア、回腸部REMIND、SES-CD、CDEISが実質的な間観察者間一致性(ICC 0.74~0.80)と大きな反応性(WinP 0.75~0.83)を示した。
• POCER指数と吻合部REMINDスコアは、低い信頼性と最小限の反応性(ICC 0.49と0.30;WinP 約0.54と0.53それぞれ)を示した。
• 全ての指標は、新終末回腸部と比較して吻合部や遠位大腸での評価でパフォーマンスが悪く、吻合部を超えた術後評価の持続的な測定ギャップを示している。
背景
クローン病(CD)の患者が回腸大腸切除術を受けた場合、新終末回腸部と吻合部の内視鏡評価は早期術後再発の検出と予防療法のガイドに中心的である。ルッゲルツスコアとそのバリエーション、POCER指数、REMINDスコア、SES-CD、CDEISなど、複数の内視鏡スコアリングシステムが存在するが、これらの指標が術後動画に適用された際の比較的測定特性は不完全に特徴付けられている。信頼性(再現性)と反応性(治療関連の違いを検出できる能力)は、臨床決定と試験エンドポイントとしての使用に不可欠である。PREVENT試験は、インフリキシマブ(REMICADE)による術後再発の予防を評価する無作為化プラセボ対照試験であり、標準化された回腸大腸内視鏡動画のセットを提供し、これらの測定特性の厳密な評価を可能にした。
研究設計
この研究は、PREVENT試験(術後再発リスクが高いクローン病患者に対する手術切除後の再発予防を目的とした、無作為化二重盲検プラセボ対照試験)で取得された回腸大腸内視鏡動画の二次的盲検中央読影解析である。70件の動画は、治療割り付けと臨床データを盲検にした3人の中央読影者によって独立してレビューされた。新終末回腸部、吻合部、遠位大腸での疾患活動度は、複数の指標を使用して評価された:ルッゲルツスコアと変形ルッゲルツスコア、POCER指数、REMINDスコア(回腸部と吻合部の成分)、クローン病単純内視鏡スコア(SES-CD)、クローン病内視鏡重症度指標(CDEIS)。
方法 — 信頼性と反応性の指標
間観察者間一貫性は、クラス内相関係数(ICC)を使用して定量され、一般的な解釈閾値(ICC >0.75:実質的から優秀;0.40–0.75:中等度;<0.40:公平から不良)が使用された。インフリキシマブ治療への反応性は、勝率(WinP)指標を使用して定量された:インフリキシマブ群からランダムに選択された患者が、プラセボ群からランダムに選択された患者よりも良い(低い)スコアを持つ確率。WinP値が0.5に近い場合は差別力がないことを示し、0.7以上は有意な反応性を示す。
主要な知見
間観察者間一貫性
ルッゲルツスコアと変形ルッゲルツスコア、回腸部REMINDスコア、SES-CD、CDEISは、実質的な信頼性(ICC範囲 0.74~0.80)を示した。POCER指数は中等度の信頼性(ICC 0.49)を示した。吻合部のREMINDスコアは、吻合部での病変に対する著しい観察者間不一致を反映して、性能が悪かった(ICC 0.30)。
反応性(治療差別)
信頼性と反応性の両方を示した指標には、ルッゲルツスコアと変形ルッゲルツスコア、回腸部REMIND、SES-CD、CDEISがあり、各々が大きな反応性(WinP 0.75~0.83)を示した。実践的には、インフリキシマブに無作為化された患者は、プラセボと比較してこれらの指標のスコアが大幅に良かったことが示され、観察者間の一貫性も確認された。
対照的に、POCER指数と吻合部REMINDスコアは、僅かな反応性(WinP 約0.54と0.53それぞれ)しか示さず、治療とプラセボの間の弱い差別性を示した。
部位ごとのパフォーマンス
全指標において、新終末回腸部に限定された評価は、吻合部や遠位大腸に焦点を当てた評価よりも高い信頼性と反応性の推定値を産出した。これは、既存のツールが回腸粘膜の外観に最適化されており、吻合部の病理や術後の遠位大腸再発を一貫してグレード付けする能力が低いことを示唆している。
臨床解釈への影響
術後再発の検出と治療効果の評価(例えば、臨床試験で)を目指す場合、ルッゲルツスコアベースのツール、回腸部REMIND、SES-CD、CDEISは、新終末回腸部での再現性と感度の最良の組み合わせを提供する。POCER指数や吻合部特異的REMIND成分の使用は、測定ノイズを増加させ、治療効果の検出能力を低下させる可能性がある。
専門家コメントと文脈化
この研究は、術後クローン病管理における実用的な測定問題に対処している。ルッゲルツスコアは、術後リスク分類の基盤であり、この解析は、盲検中央読影者によって使用される際に、いくつかの回腸中心の指標の価値を強調している。重要な臨床的および方法論的な考慮事項が続く。
なぜ吻合部の評価が性能が悪いのか?
吻合部は解剖学的および視覚的に多様である:ステープル線、粘膜接合、手術技術、短区間虚血、瘢痕化などが活動性炎症を模倣または隠す可能性がある。内視鏡的特徴(粘膜浮腫、新生血管、小さな浸食)は微妙で、解釈が異なる可能性がある。吻合部REMINDスコアの低いICCは、明確な定義、標準化されたイメージングプロトコル(例如、充気、洗浄、複数の視点)、および補助的なイメージングモダリティ(高精細イメージング、染色内視鏡)の必要性を強調している。
試験と診療への実践的影響
術後設定の臨床試験では、信頼性と反応性が証明されている主要な内視鏡エンドポイントを選択することが重要である。結果は、エンドポイント選択と中央読影において、回腸スコア(ルッゲルツスコア、変形ルッゲルツスコア、回腸部REMIND、SES-CD、CDEIS)を優先することを支持している。日常の臨床診療では、中央読影は実現不可能であるため、吻合部での合意が低いことを認識し、治療のエスカレーション(例えば、治療強化)の単一観察者判断を抑制し、補助的な評価(放射線、バイオマーカー、再内視鏡、または多職種協議)を促すべきである。
考慮すべき制限
いくつかの制限が強調されるべきである。解析には、術後再発リスクが高い無作為化試験集団から70件の動画が使用されたため、結果は全ての術後コホートに一般化できない可能性がある。中央読影者は専門家であり、地域の消化器科医は異なる信頼性パターンを示す可能性がある。WinPは、患者間の差別性を評価するものであり、時間経過による患者内の変化を評価するものではない。補完的な反応性指標(例如、標準化反応平均)が追加の洞察を提供する可能性がある。最後に、本研究は内視鏡測定特性を扱っているが、これらの長期的な臨床アウトカム(例如、症状性再発、再手術)への直接的な翻訳は行っていない。
結論
この中央読影解析では、回腸大腸切除術後の新終末回腸部を評価するために使用される一般的な内視鏡指標——特にルッゲルツスコアと変形ルッゲルツスコア、回腸部REMIND、SES-CD、CDEIS——が実質的な間観察者間一貫性と良好なインフリキシマブ治療への反応性を示していることが示された。逆に、吻合部に焦点を当てた指標(吻合部REMIND)やPOCER指数は、低い合意度と限定的な治療差別性を示しており、性能が低い。これらの結果は、術後試験での回腸中心の内視鏡エンドポイントの継続的な使用を支持し、吻合部と遠位大腸の測定ギャップを解消するための方法論的改善が必要であることを強調している。
臨床的および研究的意義
研究者向け:術後クローン病試験を設計する際は、証明された信頼性と反応性のある回腸指標を優先し、可能であれば中央盲検読影者を使用すること。臨床医向け:吻合部や遠位大腸の内視鏡所見を慎重に解釈し、治療のエスカレーション前に補完的な証拠(臨床経過、バイオマーカー、画像)を検討すること。研究者向け:明確な吻合部特異的定義、標準化されたイメージングプロトコルを開発し、高精細イメージング、染色内視鏡、AI支援画像解析などの補助的モダリティを探求して、再現性を向上させること。
資金提供とclinicaltrials.gov
PREVENT試験の資金提供と詳細な試験登録情報は、主要試験公表文献とHanzel J et al. Clin Gastroenterol Hepatol. 2025(下記引用)に報告されている。読者は、主催者と登録識別子についてPREVENT試験ドキュメントを参照するべきである。
参考文献
1. Hanzel J, Vuyyuru SK, Bressler B, et al. Reliability and Responsiveness of Endoscopic Indices for Assessing Crohn’s Disease Postoperative Recurrence in the PREVENT trial. Clin Gastroenterol Hepatol. 2025 Sep 2:S1542-3565(25)00741-4. doi: 10.1016/j.cgh.2025.08.021. PMID: 40907850.
2. Rutgeerts P, Geboes K, Vantrappen G, et al. Predictability of post-operative recurrence by endoscopic assessment. (Original Rutgeerts score publication). Gastroenterology. 1990; [classic reference establishing Rutgeerts scoring system].
3. Daperno M, D’Haens G, Van Assche G, et al. Development and validation of the Simple Endoscopic Score for Crohn’s Disease (SES-CD). Gut. 2004;53:591–596.
4. Mary JY, Modigliani R. Development of the Crohn’s Disease Endoscopic Index of Severity (CDEIS). Gastroenterol Clin Biol. 1989;13(1):70–72.
5. De Cruz P, Kamm MA, Hamilton AL, et al. POCER: postoperative recurrence study and index development. (POCER trial/publications detailing index use and performance).
注:参考文献2と5は、記述された指標とPOCERフレームワークの古典的かつ広く知られた情報源として与えられている。読者は、完全な方法論的詳細(ECCO術後管理ガイドラインなど)のために、元の指標公表文献とガイドラインドキュメントを参照することを奨励する。
著者注
この記事は、Hanzel et al. (2025)の結果を合成・解釈し、臨床医と研究者向けに準備された医学科学ライターによるものである。操作的詳細(スコアリングマニュアル、画像例)については、元の公表文献と補足資料を参照のこと。
サムネイル画像プロンプト
新終末回腸部に小口瘡が見える内視鏡モニターのアップビュー;多様な性別と人種の3人の医師が、近代的な臨床カンファレンスルームで大型画面に映る動画を熱心にレビューしている様子;テーブルには匿名化された患者データが入力されたスコアシートとラップトップが見え、冷たい臨床照明、写実的、高精細。

