ハイライト
- 新しい診断を越えたモデルは、現実の臨床データを使用して6年間の精神病または双極性障害のリスクを予測し、C指数0.80を達成しました。
- この研究では、英国の12万7868人の患者のデータを使用し、社会人口統計学、薬剤、NLPから導出された症状など、77の予測因子を組み込みました。
- 意思決定曲線分析によると、このモデルを実装することで、標準的なケアと比較して、100人のスクリーニング患者あたり3件の追加的な精神病または双極性障害の症例を検出できることが示されました。
- このモデルは優れた適合性を示しており、二次精神医療設定における個別化されたリスク評価の信頼性が示されています。
背景:精神医療における早期検出の重要性
早期介入は現代的精神医学の基盤であり、特に精神病や双極性障害などの重篤な精神疾患において重要な役割を果たします。これらの病気は通常、思春期後半または成人初期に発症し、治療されない場合、長期的な障害、生活の質の低下、高い経済的コストにつながります。従来、リスク検出のための臨床経路は孤立しており、精神病か気分障害のいずれかに焦点を当てていました。しかし、最近の証拠は、これらのカテゴリー間で初期段階の症状や共有される遺伝的・環境要因に有意な重複があることを示唆しています。
精神病と双極性障害の両方のリスクを同時に特定できる診断を越えたアプローチに対する重要な未充足のニーズがあります。このようなツールがあれば、医師は反応型のケアから先制的かつ予防的なモデルへと移行できます。電子健康記録(EHR)を使用した臨床予測モデル(CPM)の開発は、医師が客観的かつデータ駆動型のリスク推定値を得て、個々の患者に合わせたリスク評価を行うための有望な手段です。
研究設計:現実の証拠とAIの活用
この研究はRECORDおよびTRIPOD+AIステートメントに準拠し、6年間の精神病または双極性障害の発症リスクを推定するためのCPMの開発と検証を目指しました。研究者たちは、ヨーロッパ最大の二次精神医療提供者の1つであるサウスロンドン・アンド・モーズリー(SLaM)NHSファウンデーション・トラストのデータを使用しました。データセットには、2008年1月1日から2021年8月10日の間に非器質的、非精神病的、非双極性の精神障害の初発診断が記録されたすべての年齢層の患者が含まれています。
対象患者群と除外基準
最終コホートは12万7868人の患者で構成されています。モデルが既存の疾患の追跡ではなく新規発症の疾患を予測することを確保するために、対象となる診断前に長時間作用型注射抗精神病薬やクロザピンを投与された患者は除外されました。また、データの品質を確保するためにウォッシュアウト期間が設けられ、フォローアップ連絡がない患者も除外されました。
予測因子とモデリング
研究者たちは、最小絶対縮小選択演算子正則化(LASSO)コックス比例ハザードモデルを使用しました。この手法は、高次元データを処理しながら過学習を防ぐことに特に効果的です。合計77の予測因子が組み込まれ、これらはインデックス日から6ヶ月前の期間から導出されました:
- 社会人口統計学的および臨床的な予測因子(5変数、年齢や民族性を含む)。
- 服薬歴(4変数)。
- 入院歴(2変数)。
- 自然言語処理(NLP)から導出された兆候、症状、物質使用(66変数)。
NLPから導出されたデータの組み込みは、重要な方法論的な強みであり、具体的な幻覚、気分の変動、物質乱用のパターンなど、構造化されていない臨床ノートに埋もれている微妙な臨床情報をモデルが捉えることができます。
検証戦略
モデルの堅牢性と汎化性を確保するために、チームは内部-外部検証を使用しました。これは、SLaMがサービスを提供する5つの自治体のうち1つをテストのために除外し、残りの4つでモデルを訓練することを意味します。このプロセスは各自治体に対して繰り返され、性能結果が平均化されました。
主要な知見:モデルの性能と精度
研究コホートは多様で、平均年齢は33.4歳でした。性別の分布はほぼ均等(男性50.8%、女性49.0%)、民族性データは南ロンドンの都市人口を反映していました(白人55.8%、黒人14.1%、アジア人4.9%)。6年以内に精神病または双極性障害を発症する累積リスクは0.0827(8.27%)でした。
識別力と適合性
モデルはいくつかの重要な指標で優れた性能を示しました:
- C指数:0.80(95% CI 0.78-0.81)。これは、疾患を発症する患者と発症しない患者を区別する高い能力を示しています。
- 適合傾斜:1.02(SD 0.14)。傾斜が1に近いことから、予測確率が観察された結果とよく一致していることが示されます。
- 大規模適合:0.06(SD 0.02)。この指標は、モデルが予測する全体のリスクが人口での実際のリスクに近いことを確認します。
これらの結果は、モデルがランキングだけでなく、絶対的なリスクの百分率を提供し、医師が治療決定を下すために使用できる信頼性の高いものであることを示唆しています。
臨床的有用性:統計的有意性を超えて
統計的指標であるC指数は重要ですが、予測モデルの真の価値はその臨床的有用性にあります。研究者たちは、デシジョンカーブ分析(DCA)を行い、モデルを使用することでデフォルトの戦略(全員がリスクにあると仮定するか、誰もリスクがないと仮定する)よりも良い臨床的決定が下せるかどうかを評価しました。
DCAは、モデルが広範な閾値確率範囲で著しい純利益を提供することを示しました。具体的には、研究者たちは、100人のスクリーニング患者あたり3件の追加的な精神病または双極性障害の症例を早期に検出できると推定しました。大きな医療システムでは、これは数百人の個人が早期介入を受け、長期的な病態軌道が変わる可能性があります。
専門家のコメント:強み、限界、将来の方向性
この研究は、AIと機械学習を精神医療に適用する分野で重要な進歩を表しています。診断を越えたフレームワークは、早期段階の精神症状がしばしば非特異的であるという臨床的現実を認識しています。リスク評価フェーズで硬直した診断カテゴリーから離れることが、より生物学的かつ臨床的に真実を反映しています。
強み
研究の主な強みは、その巨大な規模と現実のEHRデータの使用です。厳密に管理された臨床試験とは異なり、このモデルは日常の診療で見られる複雑で混乱したデータに基づいて構築されています。これにより、実際の臨床設定で良好に機能する可能性が高くなります。自由テキストノートから臨床兆候を抽出するためのNLPの統合も、看護師や医師が記録する「臨床的直感」を伝統的なデータベースクエリが無視する部分を捉える技術的な飛躍です。
限界
印象的な結果にもかかわらず、いくつかの限界を考慮する必要があります。まず、モデルは単一(ただし大規模な)NHSトラスト内で開発および検証されました。異なる地理的地域や異なる医療システム(例えば、民間保険ベースのシステム)での外部検証が必要です。次に、著者らが指摘するように、経験を持つ人々が設計や執筆過程に参加していません。今後のバージョンでは、測定される結果やコミュニケーションの方法が患者中心であることを確認するために、患者の視点を組み込む必要があります。最後に、モデルはリスクを特定しますが、どの患者に最適な介入が行われるかを指定していないことは、精密精神医学にとって必要な次のステップです。
結論
この診断を越えた臨床予測モデルの開発は、精神医学における系統的な早期検出への重要な転換点を示しています。C指数0.80と明確な臨床的有用性の証拠により、このツールは二次医療における高リスク個体を特定するための堅牢な方法を提供します。このようなモデルを電子健康記録システムに統合することで、医療提供者はより予防的なアプローチに移行し、若者や医療システム全体における精神病と双極性障害の負担を軽減することができます。
資金と参考文献
この研究は、UK Medical Research Council (MR/N013700/1) と National Institute for Health Research (NIHR) Biomedical Research Centres at South London and Maudsley NHS Foundation Trust および Oxford Health NHS Foundation Trust の資金提供を受けました。
参考文献
Arribas M, de Micheli A, Krakowski K, Stahl D, Correll CU, Young AH, Andreassen OA, Vieta E, Arango C, McGuire P, Oliver D, Fusar-Poli P. Joint detection of risk for psychotic disorders or bipolar disorders in clinical practice in the UK: development and validation of a clinical prediction model. Lancet Psychiatry. 2026 Jan;13(1):14-23. doi: 10.1016/S2215-0366(25)00307-4. Epub 2025 Nov 26. PMID: 41317739.

