亮点
- 一种新的跨诊断模型使用真实世界临床数据,在6年内预测精神分裂症或双相障碍风险时达到了0.80的C指数。
- 该研究利用了来自英国127,868名患者的数据,包括77个预测因子,如社会人口学特征、药物使用和自然语言处理提取的症状。
- 决策曲线分析表明,与标准护理相比,实施该模型可以每筛查100名患者额外检测出3例精神分裂症或双相障碍病例。
- 该模型表现出色的校准性,表明其在二级心理健康环境中进行个性化风险评估的可靠性。
背景:心理健康早期检测的重要性
早期干预是现代精神病学的核心,尤其是在严重精神疾病如精神分裂症和双相障碍方面。这些疾病通常在青少年晚期或成年早期出现,如果未得到治疗,会导致长期残疾、生活质量下降和高昂的经济成本。传统上,检测风险的临床路径是孤立的,分别关注精神分裂症或情绪障碍。然而,最近的证据表明,这些类别之间在早期症状和共同的遗传及环境风险因素方面存在显著重叠。
需要一种跨诊断方法来联合识别精神分裂症和双相障碍风险的个体。这样的工具将使临床医生能够超越被动护理,转向主动预防模式。使用电子健康记录(EHR)开发临床预测模型(CPM)提供了一个有前景的途径,为临床医生提供了客观、数据驱动的风险估计,这些估计是针对个别患者的。
研究设计:利用真实世界证据和人工智能
本研究符合RECORD和TRIPOD+AI声明,旨在开发和验证一个CPM,以估计6年内发展为精神分裂症或双相障碍的风险。研究人员使用了南伦敦和莫兹利(SLaM)NHS基金会信托的数据,这是欧洲最大的二级心理健康护理提供者之一。数据集包括所有年龄段的患者,他们在2008年1月1日至2021年8月10日期间记录了非器质性、非精神病性和非双相情感障碍的初始诊断。
患者人群和排除标准
最终队列包括127,868名患者。为了确保模型预测的是新发疾病而不是追踪现有疾病,研究排除了在目标诊断前接受长效注射抗精神病药或氯氮平治疗的患者。此外,设立了洗脱期以确保数据质量,并排除了无随访接触的患者。
预测因子和建模
研究人员采用最小绝对收缩和选择算子正则化(LASSO)Cox比例风险模型。这种方法特别擅长处理高维数据并防止过拟合。共纳入了77个预测因子,这些预测因子是从索引日期前6个月的时间段内提取的:
- 社会人口学和临床预测因子(5个变量,包括年龄和种族)。
- 用药史(4个变量)。
- 住院史(2个变量)。
- 自然语言处理(NLP)提取的体征、症状和物质使用情况(66个变量)。
纳入NLP提取的数据是一个重要的方法学优势,因为它允许模型捕捉埋藏在非结构化临床笔记中的细微临床信息,如具体的幻觉、情绪波动或物质滥用模式。
验证策略
为了确保模型的稳健性和普适性,团队采用了内部-外部验证。这涉及留出SLaM服务的五个行政区之一进行测试,而其余四个行政区用于训练模型。这一过程对每个行政区重复进行,性能结果取平均值。
主要发现:模型性能和准确性
研究队列具有多样性,平均年龄为33.4岁。性别分布接近均匀(男性50.8%,女性49.0%),种族数据反映了南伦敦的城市人口(白人55.8%,黑人14.1%,亚洲人4.9%)。6年内发展为精神分裂症或双相障碍的累积风险为0.0827(8.27%)。
辨别力和校准性
该模型在几个关键指标上表现出色:
- C指数:0.80(95% CI 0.78-0.81)。这表明该模型在区分将发展为这些疾病和不会发展的患者方面具有很高的能力。
- 校准斜率:1.02(SD 0.14)。接近1的斜率表明预测概率与观察结果一致。
- 总体校准:0.06(SD 0.02)。这一指标确认模型预测的整体风险接近实际风险。
这些结果表明,该模型不仅在排名上准确,还提供了可靠的绝对风险百分比,临床医生可以用这些数据来指导治疗决策。
临床效用:超越统计意义
虽然像C指数这样的统计指标非常重要,但预测模型的最终价值在于其临床效用。研究人员进行了决策曲线分析(DCA),以评估使用该模型是否能比默认策略(如假设每个人都有风险或没有人有风险)做出更好的临床决策。
DCA显示,该模型在广泛的阈值概率范围内提供了显著的净收益。具体而言,研究人员估计,该模型可以每筛查100名患者额外检测出3例精神分裂症或双相障碍病例。在大型医疗系统中,这转化为数百名个体可以更早地接受干预,从而可能改变他们的长期疾病轨迹。
专家评论:优势、局限性和未来方向
这项研究代表了人工智能和机器学习在心理健康应用方面的重要进展。跨诊断框架的使用认识到早期精神病症状往往是非特异性的。通过在风险评估阶段摆脱严格的诊断类别,该模型反映了更生物学和临床的真实情况。
优势
该研究的主要优势是其巨大的规模和使用真实世界EHR数据。与严格控制的临床试验不同,该模型基于日常实践中复杂且杂乱的数据构建,使其更有可能在实际临床环境中表现良好。将NLP整合以从自由文本笔记中提取临床体征也是一个重大的技术飞跃,捕捉了护士和医生经常记录但被传统数据库查询忽略的“临床直觉”。
局限性
尽管结果令人印象深刻,但仍需考虑几个局限性。首先,该模型是在单一(尽管规模较大)NHS信托机构中开发和验证的。外部验证在不同的地理区域或不同的医疗系统(例如,基于私人保险的系统)中进行,以确保普适性。其次,正如作者所指出的,具有生活经验的个人没有参与设计或撰写过程。未来此类模型的迭代应纳入患者视角,以确保测量的结果和沟通方式以患者为中心。最后,虽然该模型识别了风险,但并未指定哪种干预措施最适合哪些患者——这是精准精神病学的必要下一步。
结论
这种跨诊断临床预测模型的开发标志着精神病学系统早期检测的重大转变。凭借0.80的C指数和明确的临床效用证据,该工具为在二级护理中识别高风险个体提供了一种可靠的方法。通过将此类模型整合到电子健康记录系统中,医疗保健提供者可以转向更加预防性的方法,从而可能减少精神分裂症和双相障碍对年轻人和整个医疗系统的负担。
资助和参考文献
这项研究由英国医学研究委员会(MR/N013700/1)和国家卫生研究所(NIHR)生物医学研究中心(南伦敦和莫兹利NHS基金会信托和牛津健康NHS基金会信托)资助。
参考文献
Arribas M, de Micheli A, Krakowski K, Stahl D, Correll CU, Young AH, Andreassen OA, Vieta E, Arango C, McGuire P, Oliver D, Fusar-Poli P. 联合检测临床实践中精神分裂症或双相障碍的风险:临床预测模型的开发和验证。Lancet Psychiatry. 2026年1月;13(1):14-23. doi: 10.1016/S2215-0366(25)00307-4. Epub 2025年11月26日。PMID: 41317739。

