机器学习在个性化学校正念训练预防青少年抑郁症中的不足:MYRIAD试验见解

机器学习在个性化学校正念训练预防青少年抑郁症中的不足:MYRIAD试验见解

亮点

MYRIAD试验的二次分析表明,尽管技术上可行,机器学习方法在个性化学校正念训练(SBMT)中对青少年的预测结果在临床上微不足道。基线症状严重程度较低至中等是干预效果最一致的预测因素,但即使被识别的亚组也显示出最小的结局差异。这些发现挑战了在普遍性的学校心理健康项目中实施个性化预防方法的可行性。

背景:青少年抑郁症的负担

抑郁症最常在青少年时期出现,标志着预防干预的关键窗口。学校正念训练(SBMT)作为一种有前景的可扩展方法,有可能在临床症状完全显现之前覆盖大量年轻人。尽管广泛实施,但SBMT的有效性证据一直不一致,促使研究人员探索是否更个性化的做法可能会带来更好的结果。寻找能够预测最有可能从这些干预措施中受益的个体的生物标志物和基线特征,代表了心理健康预防领域向精准医学范式的转变。

研究设计与方法

“我的青少年韧性”(MYRIAD)试验于2016年10月至2018年7月在英格兰、苏格兰、威尔士和北爱尔兰具有广泛代表性的中学进行。这项二次分析利用了校级嵌套交叉验证来训练和评估预测SBMT个体化获益的机器学习模型。该研究包括来自84所英国中学的8,376名11至13岁的青少年,其中女性参与者4,509名(54.9%),男性参与者3,547名(43.2%)。数据分析时间为2023年4月至2025年10月。

参与者按学校随机分配到SBMT组——通过心理教育、课堂讨论和结构化练习教授核心正念技能——或常规社会情感学习组。主要结局是从干预前到干预后的抑郁症状变化,使用流行病学研究中心抑郁量表(CES-D)测量。采用了两种机器学习方法:因果森林(CF)和弹性网回归(ENR),两者均计算个性化优势指数得分,量化了SBMT相对于常规教学的个体预期获益。

关键发现

模型性能与校准

因果森林模型表现出可接受的校准,最佳线性预测斜率为0.78(SE 0.15),表明预测值与观察值之间的一致性合理。然而,弹性网回归模型的预测性能较为一般,相关系数为0.29,R²为0.09,均方根误差为10.3。这些指标表明,尽管模型可以在数据中检测到一些信号,但个体结局的大量变异仍未得到解释。

干预反应预测

CF和ENR模型均识别出可能从SBMT中受益的青少年亚组。然而,当这些预测被测试时,组间的结局差异微乎其微。对于CF模型,效应量为d = 0.07(95% CI, 0.02-0.12;P = .007),而ENR模型的效应量为d = 0.08(95% CI, 0.02-0.13;P = .004)。尽管这些差异在大样本量下达到了统计学显著性,但在实际应用中,这些效应的临床意义几乎可以忽略不计。

主要预测特征

因果森林模型将症状严重程度确定为主要的干预效果预测因素。值得注意的是,基线时轻度至中度的抑郁和焦虑预示着更大的SBMT获益,这表明了一个潜在的干预目标点。一些学校层面的因素也被确定为重要的预测因素,但这些因素表现出复杂的非线性模式,使得直接解释变得复杂。弹性网回归模型更加重视学校层面的特征,而在个别学生层面提供的区分度较小。

专家评论:意义与局限

这些发现揭示了在普遍性的学校预防项目中实现临床有用的个性化所面临的巨大挑战。适度的预测性能和微小的效应量表明,这一人群的治疗效果异质性可能太小,无法用当前的方法检测出来,或者支持SBMT获益的机制与预期不同。

需要考虑几个局限性。首先,研究依赖于自我报告的症状测量,这可能会引入测量噪声,限制预测准确性。其次,84所学校的样本虽然相当可观,但可能无法涵盖SBMT可能实施的所有教育和文化背景的多样性。第三,相对较短的随访期可能遗漏了长期的获益或伤害轨迹,这些轨迹可能会提供更细致的预测信息。

此外,学校层面预测因子中观察到的非线性模式表明,环境因素可能以复杂的方式影响干预反应,这是线性模型难以捕捉的。这引发了当前机器学习方法是否适合用于心理健康预防情境的问题,在这些情境中,结果受到个体特征和环境因素之间复杂相互作用的影响。

从临床角度来看,这些结果并不一定否定SBMT作为一种干预措施的价值——而是突显了精准医学在预防精神病学中尚未实现的承诺。针对高风险人群的定向方法可能会产生更显著的效果和更清晰的预测信号,但这将从根本上改变普遍预防模式。

结论与未来方向

MYRIAD试验的二次分析代表了迄今为止对青少年学校正念干预个性化预测最严格的检验。尽管机器学习成功地识别了一组具有统计学可检测差异反应的亚组,但考虑到效应量在现实世界中的微小影响,这一成就的临床相关性仍值得怀疑。

基线症状严重程度较低至中等预示着更大的获益,这一发现提供了潜在的行动见解:具有亚临床但升高的症状的青少年可能是SBMT的最佳目标群体。没有症状的青少年几乎没有改善的空间,而症状较重的青少年可能需要更密集的个性化干预,超出普遍项目所能提供的范围。

未来的研究应探索能够捕捉复杂个体-环境互动的替代建模方法,考虑更长时间的随访以识别延迟的治疗效果,并探讨定向而非普遍交付模式是否能实现更有意义的个性化。该领域还可能从整合多模态数据源——基因、神经影像学、生态瞬时评估——中受益,以提高预测准确性,超越仅靠基线特征所能提供的水平。

试验注册:isrctn.org 标识符:ISRCTN86619085

参考文献

Webb CA, Ren B, Hinze V, 等. 预测青少年对学校正念训练的反应:MYRIAD试验的二次分析。JAMA Psychiatry. 2026;83(4):389-398. PMID: 41706471.

Comments

No comments yet. Why don’t you start the discussion?

发表回复