序論:予測医学の新時代
想像してみてください。症状が現れる何十年も前に未来の健康リスクを知ることができれば、対象となる予防策や適切な介入が可能になります。このビジョンは、1,000以上の疾患のリスクを最大20年先まで予測する革新的な人工知能(AI)モデル、デルファイ-2Mによって現実に近づいています。国際的な研究チームによって開発され、最近Nature(「生成トランスフォーマーを用いた人間の疾患の自然史の学習」)に掲載されたデルファイ-2Mは、GPT言語モデルの技術を応用し、人間の疾患の歴史を言語のように「読み取り」、専門的な医師と同等の精度で疾患の経過を予測します。
デルファイ-2Mが疾患の言語を読み解く方法
従来の臨床リスク計算機は、通常、年齢、血圧、コレステロールなどの広範な入力値を使用して、1つか2つの疾患の発症確率を推定します。デルファイ-2Mはこれを革命化し、個人の医療タイムラインを「トークン」のシーケンスとして扱います。各トークンは、特定の年齢でのインフルエンザの感染、妊娠、糖尿病の診断など、特定のイベントを表し、性別、BMI、喫煙、飲酒習慣などの人口統計学的およびライフスタイル要因も含みます。
時間的な動態を捉えるために、研究者たちは言語モデルで単語の順序を理解するために使用される標準的な位置エンコーディングを「年齢エンコーディング」に置き換えました。これにより、デルファイ-2Mは次の疾患が何かだけでなく、いつ発生するかを予測できるようになりました。UK BioBankの40万人のデータポイント1億以上で学習した後、モデルは疾患の「文法」を学び、どの疾患が共発症しやすいか、どの疾患が重要な終点(句読点のようなもの)となるかを理解するようになりました。
1秒で1,000件のリスクレポート:パーソナライズされた動的予測
デルファイ-2Mは、1秒以内に1,000以上の疾患の詳細な「日々の発症率」予測を提供し、単一疾患のリスク推定に限定される従来の計算機を大きく上回ります。モデルは、新しい検査データや臨床データが利用可能になると、その予測を動的に更新することができます。
従来の臨床リスクスコア(QRISK3(心血管疾患)、Framinghamリスクスコアなど)との評価では、デルファイ-2Mは多くの高影響イベント(死亡、敗血症、乳がんなど)で受信者動作特性曲線(ROC曲線)の下面積(AUC)が0.8から0.97の間で、非常に高い予測精度を達成しました。さらに、190万人のデンマーク人の集団で外部検証された結果、モデルの性能はわずか2%しか低下せず、集団間で優れた汎化能力を示しました。
現実から仮想の生活へ:合成医療履歴の力
デルファイ-2Mの最も目立つ特徴の1つは、実際の疾患分布に非常に近い完全に合成のライフヒストリーを「書く」能力です。研究者たちは、6万人の既存の医療記録を60歳から20年後に延長させ、予測された人口レベルの発症率が実世界のデータと密接に一致することを確認しました。
さらに、デルファイ-2Mは40万人分の完全に合成のライフヒストリーを生成しました。この合成データで新しいモデルを学習させると、予測力はわずか3%しか低下しませんでした。このブレイクスルーは、将来の研究が患者のプライバシーを侵害することなく、匿名化された合成データセットを利用して医療の発見を加速する可能性があることを示唆しています。
AIブラックボックスの開示:透明性と信頼性
AIモデルはしばしば不透明さを批判されますが、デルファイ-2Mは疾患を「意味マップ」にマッピングすることで新たな地平を開きました。近接度は強い併発症関係を示します。例えば、さまざまな形の糖尿病は一緒にクラスタリングされ、心筋梗塞、敗血症、死亡も同様です。
SHAP(SHapley Additive exPlanations)解釈手法を使用することで、医師は患者の医療履歴のどの部分がリスク予測に最も寄与したかを見ることができます。あるケースでは、モデルは膵臓がんのリスクを19倍に高める主要な先行条件を特定しました。このような透明性は、医師がAI生成の洞察を理解し、信頼し、行動することができ、それらをブラックボックスの判断として扱うのではなく、活用することができます。
課題と倫理的考慮:データバイアスに注意
その約束にもかかわらず、デルファイ-2Mは訓練データに内在するバイアスを複製します。UK BioBankは40〜70歳の比較的裕福で主に白人の個人を対象としているため、モデルは少数民族グループや経済的に不利な人口のリスクを過小評価し、外来や地域で主に記録される疾患を見逃す傾向があります。
研究チームは、臨床導入前にデータのギャップを解消し、人口構造を再調整し、厳格な規制レビューを実施して、健康格差を悪化させたり、危害を与えたりすることを防ぐ必要があると強調しています。
今後の展望:多モーダルヘルスモデルへの道
現在、デルファイ-2Mは主にICD-10診断コードと限られたライフスタイル変数に依存しています。研究チームは、ゲノミクス、検査結果、画像スキャン、ウェアラブルデバイスデータを統合して包括的な「多モーダル」ヘルスモデルを構築することを目指しています。
将来、AIは原始的な臨床メモや画像を解釈して予測をさらに洗練することも可能です。例えば、「5年以内の心筋梗塞リスクは3%」というだけでなく、遺伝的素因、心臓MRI結果、毎日の歩数を組み合わせて、スタチンの開始、冠CTアンギオグラフィーの予約、または毎日の歩行目標の増加を推奨するようなパーソナライズされたライフスタイルや薬物調整を提案することも考えられます。
症例シナリオ:45歳の女性サラ
サラは忙しいマーケティングマネージャーで、過去の医療履歴をデルファイ-2Mを搭載したヘルスケアプラットフォームに提供します。彼女は子供の頃に2回インフルエンザに感染し、思春期に軽度の喘息があり、現在のBMIは28、若年期にはたまに喫煙し、境界型の高コレステロールを報告しています。
数秒以内に、AIはサラのパーソナライズされたリスクレポートを生成し、10年間の冠動脈疾患と2型糖尿病のリスクが若干高めであることを強調します。また、喫煙の停止やコレステロールの改善などの修正可能な要因を明らかにし、関連するスクリーニングを提案します。次に10年間、サラの検査結果や健康行動がシステムに更新されると、AIはリスクを再計算し、彼女の医師が正確に予防介入をカスタマイズできるようにします。
医療の再定義:反応型から予防型へ
デルファイ-2Mは、健康リスクが定量的、追跡可能、そして具体的に行動可能な時代をもたらします。これは、既存の疾患を治療する医療から、未来の疾患を予防する医療へのシフトを意味します。このAIは、包括的なデータに基づいて将来のリスクを警告する「健康天気予報」のようなものです。
AIは、医師の精緻な判断や共感を置き換えることはありませんが、精密医療を向上させ、疾患負担を軽減するための不可欠なツールとなります。
結論
デルファイ-2Mは、患者中心の疾患予測に生成トランスフォーマーを活用するマイルストーンであり、1,000以上の状態を臨床グレードの精度で予測することができます。合成患者履歴を生成する機能は、医療データ共有に内在するプライバシーの制約を回避する有望な道を開きます。多様なデータタイプや人口を組み込んだ公平な多モーダルモデルを達成することが、その全ポテンシャルを解き放つ鍵となります。
AI駆動のツールが医療に統合されると、早期介入、パーソナライズされた推奨、そして最終的には予防型、精密医療の未来へと移行し、サラのような個人が疾患が発症する何十年も前に健康を管理できるようになるでしょう。
参考文献
1. Alaa, A.M., et al. Learning the natural history of human disease with generative transformers. Nature (2025). https://www.nature.com/articles/s41586-025-09529-3
2. Hippisley-Cox, J., et al. Predicting cardiovascular risk in England and Wales: QRISK3. BMJ (2017)
3. D’Agostino, R.B., et al. General cardiovascular risk profile for use in primary care: the Framingham Heart Study. Circulation (2008)
4. Lundberg, S.M., Lee, S.-I. A unified approach to interpreting model predictions. Advances in Neural Information Processing Systems (2017)