一夜睡眠检查为何可能“误判”:夜间间变异性与AHI评分规则的隐性影响

一夜睡眠检查为何可能“误判”:夜间间变异性与AHI评分规则的隐性影响

标题

一项睡眠监测为何可能“看走眼”:夜间间变异性、AHI判定规则及其对阻塞性睡眠呼吸暂停诊断的隐性影响

摘要

一项为期两晚的多导睡眠监测(polysomnography,PSG)研究发现,阻塞性睡眠呼吸暂停(obstructive sleep apnea,OSA)的诊断结果会因呼吸暂停低通气指数(apnea-hypopnea index,AHI)的评分规则而显著改变;与3%/觉醒标准相比,采用4%氧饱和度下降标准会导致更多的重新分类。夜间低氧负荷在不同夜晚之间则更为稳定。

研究亮点

多导睡眠监测中的夜间间变异性(night-to-night variability,NtNV)在不同睡眠指标中的表现并不一致:体位、自主神经及睡眠结构相关指标波动最大,而氧合指标和低氧负荷相对稳定。

在这项前瞻性两晚PSG研究中,共纳入147名既往已诊断或疑似中重度OSA的成年人,呼吸事件频率相关指标是变异模式的主要驱动因素。

采用4%氧饱和度下降规则评分的AHI所致诊断重新分类多于采用3%/觉醒规则评分的AHI,提示阈值选择会实质性影响哪些患者被标记为具有临床意义的OSA。

低氧负荷在两晚之间的不一致性较低,支持这样一种观点:与仅基于事件计数相比,以氧合为基础的指标可能提供更稳定的生理信号。

研究背景

阻塞性睡眠呼吸暂停十分常见,但常被漏诊,并且与白天嗜睡、事故风险、高血压、房颤、卒中以及心代谢性疾病密切相关。然而,其诊断仍常被简化为一个数字:AHI。这种简化方式有利于临床流程和支付政策,但也存在代价。由于睡眠期分布、体位、鼻塞、饮酒、药物、觉醒阈值以及传感器/评分差异等因素都会影响事件计数,AHI可能在不同夜晚之间发生变化。

这一问题在接近决策阈值的患者中最为重要。某位患者的AHI若仅略低于诊断截点,尽管疾病具有明确临床意义,仍可能被拒绝治疗;而另一位患者则可能因所用评分规则不同而被归入不同类别。随着低通气事件可采用不同定义进行评分,问题变得更为复杂,其中最常见的是更宽松的3%/觉醒标准与更严格的4%氧饱和度下降标准。这些定义并不能相互替代:它们会改变疾病患病率、严重程度分层、治疗资格以及保险覆盖范围。

Alavi及其同事的研究针对一个长期存在且具有现实意义的空白问题:当两次PSG间隔较短时,由PSG获得的指标有多稳定?表面上的诊断不稳定中,有多少是由AHI阈值本身驱动,而非真实的生理波动所致?作者还考察了低氧负荷这一新近指标。该指标可捕捉睡眠期间氧饱和度下降的累积深度和持续时间,可能比单纯AHI更能反映生理应激。

研究设计

本研究对一项前瞻性研究进行了回顾性分析,共纳入147名受试者,他们要么既往已诊断为OSA,要么在基线评估时高度怀疑存在中重度OSA。每位受试者在10天内完成两次完整的PSG,从而使研究者能够在相对接近的条件下评估短间隔夜间间变异性。

研究评估了20项PSG衍生指标,涵盖呼吸事件频率、氧合、心脏/自主神经指标以及睡眠结构变量。研究者对这些指标的NtNV进行了量化,并使用标准化变异矩阵,随后进行主成分分析(principal component analysis,PCA)和无监督k-means聚类,以识别具有不同变异模式的群体。他们还比较了两种常用的低通气评分定义下诊断稳定性的差异:基于3%氧饱和度下降或觉醒的AHI,以及基于4%氧饱和度下降的AHI。最后,采用统计校准模型推导出AHI 4%阈值,使其与标准AHI 3%/觉醒严重程度切点相一致。

重要终点包括总体分类不一致率、中重度阈值处的不一致率,以及低氧负荷风险分层的稳定性。通俗地说,该研究试图回答:同一个人在两次不同夜晚的PSG中会不会被归为相同类别,以及这一答案是否取决于所使用的指标。

主要结果

1)夜间间变异性确实存在,但在不同PSG指标之间并不均匀

作者发现NtNV存在明显异质性。波动最大的指标包括最高心率、体位比例以及入睡潜伏期。这些变异来源并不令人意外:体位可显著影响上气道塌陷性,入睡潜伏期可因首夜效应或睡眠压力变化而改变,心率则可能反映对呼吸不稳定和睡眠片段化敏感的自主神经觉醒反应。

相较之下,平均血氧饱和度、平均心率、最低血氧饱和度以及低氧负荷是最稳定的指标之一。这一发现具有重要临床意义,因为它提示氧合相关指标可能比单纯事件计数更不易受到短期波动的影响。如果某项指标可重复性更高,则其更可能成为风险分层和疗效监测的可靠标志物。

2)呼吸事件频率指标主导了大部分变异结构

在PCA和聚类分析中,呼吸事件频率指标对受试者分为低变异与高变异模式组的贡献最大。这表明OSA中的变异并非随机噪声,而更像是由呼吸事件计数在不同夜晚之间变化的幅度所形成的聚集特征。

从临床角度看,这一点非常重要,因为“临界”疾病患者尤其容易被重新分类。若疾病主要受体位效应或睡眠期分布变化影响,患者可能在某一夜表现为轻度,而在另一夜表现为中度,即使其基础病理生理状态并未改变。

3)采用4%标准评分的AHI较采用3%/觉醒标准的AHI更易产生诊断不一致

与临床和政策最相关的发现是:使用4%氧饱和度下降定义评分的AHI,其分类不一致性高于使用3%/觉醒定义评分的AHI。短间隔比较中,AHI 4%的总体不一致率为29.9%,而AHI 3%/觉醒为21.2%。在中重度阈值处,不一致率分别为14.3%和5.4%。

在纵向比较中,这一差距仍然存在且进一步扩大:AHI 4%的总体不一致率为45.9%,而AHI 3%/觉醒为31.1%;中重度阈值处的不一致率分别为20.9%和8.2%。这些差异具有明确临床意义。它们表明,更严格的4%规则并不仅仅是定义疾病的一种更保守方式;它还似乎更不稳定,更容易在不同夜晚之间对患者进行重新分类。

其实际意义十分直接:依据不同评分规则,同一患者可能在诊断或治疗资格分类中进出不同类别,而其基础风险并未真正改变。这对临床决策中接近AHI切点的个体,以及保险授权尤为重要。

4)低氧负荷相对稳定

低氧负荷在不同夜晚之间的不一致性较低,仅为11.8%。这种相对稳定性增强了这样一种观点:与AHI相比,低氧负荷捕捉到的是更一致的生理信号。与按小时统计事件次数的AHI不同,低氧负荷整合了氧饱和度下降的深度和持续时间,因此可能更能反映睡眠呼吸障碍所带来的总氧负荷。

尽管该研究并未以硬终点验证其优越性,但从生物学和实用角度看,低氧负荷的稳定性都很有吸引力。受夜间波动影响较小的指标,可能更适合用于风险预测、纵向随访和疗效评估。

5)阈值校准显示,AHI 4%的切点需要向下调整

校准模型提示,AHI 4%的6.1-6.9次/小时和18.4-22.3次/小时阈值,分别与AHI 3%/觉醒的15次/小时和30次/小时严重程度切点相一致。换言之,某一给定的AHI 3%/觉醒严重程度类别,在映射到AHI 4%时,对应的数值显著低于许多临床医生或支付方的直觉预期。

这一发现强调了一个常见却常被低估的问题:不同评分系统之间,严重程度分层并不可直接互换。如果在不同低通气定义之间不加调整而沿用相同名义阈值,就会系统性地误分类疾病负担。其后果不仅仅是术语上的争议,还会影响治疗可及性、围手术期规划以及长期病历记录。

临床解读

本研究强化了三个重要原则。第一,OSA是一种动态性疾病,单夜PSG只能反映其中一部分情况。第二,并非所有PSG指标的行为方式都相同:呼吸事件计数比氧合指标更具波动性,而体位和自主神经反应的波动可能更大。第三,低通气定义的选择并非无关紧要的技术细节——它会实质性改变分类稳定性及后续医疗管理。

对于临床医生而言,这意味着应结合症状、合并症、体位、睡眠结构和氧合指标来解读临界AHI,而不应孤立地看待该数值。对于临床高度怀疑但某一夜AHI未达诊断标准的患者,仍应考虑重复检查、替代检测策略,或对其PSG结果进行更广泛的生理学解读。

对于指南制定者和支付方而言,该研究进一步支持了这样的担忧:基于4%氧饱和度下降的评分标准对某些临床用途而言可能过于严格。它或许能够识别出一部分氧饱和度下降负荷更重的患者,但也可能降低诊断敏感性并增加夜间间重新分类。校准结果提示,阈值不能在不同评分定义之间不经调整地直接移植。

专家点评

本研究具有多项优势。其在较短间隔内实施了两次PSG,从而减少了长期疾病进展造成的混杂因素。研究并未仅依赖AHI,而是评估了一组广泛的生理指标。研究还采用数据驱动的聚类方法来刻画变异模式,这使其方法学深度超越了简单的成对比较。

当然,本研究也存在重要局限。队列中既往已诊断或高度疑似中重度OSA的受试者占比更高,因此结果未必适用于轻度疾病、基线患病概率较低或以中枢性睡眠呼吸暂停为主的患者。尽管数据收集为前瞻性,但回顾性分析设计仍限制了因果推断。该研究也未能确定哪项指标最能预测睡眠嗜睡、心血管事件或治疗反应等临床结局。稳定性固然重要,但仅有稳定性并不能证明其预后优越性。

另一个需要注意的因素是,即使在受控条件下,PSG本身也并非完全可重复。传感器放置、评分者解释以及实验室流程均可影响结果。因此,观察到的部分变异可能反映的是测量差异而非生物学差异。不过,这也正说明了更稳定的生理标志物为何有价值。

当前的临床实践和支付政策仍常依赖AHI切点,尤其是基于4%氧饱和度下降的切点。本研究进一步表明,这种做法对于细致的OSA表型分层可能过于粗糙。以氧合为中心的方法,包括低氧负荷,未来或可与事件计数互补,甚至在一定程度上取代后者,尤其是在后续研究证实其对症状和心血管风险具有更佳预测能力的情况下。

结论

Alavi及其同事表明,OSA的夜间间变异性在不同PSG指标之间并不均匀,而且AHI评分定义的选择会强烈影响诊断稳定性。体位、自主神经及睡眠结构相关指标波动最大,而氧合指标和低氧负荷相对稳定。与3%/觉醒规则相比,采用4%氧饱和度下降标准评分的AHI会导致更多夜间重新分类,提示部分表面上的不稳定性是由阈值驱动,而非纯粹的生理波动所致。

对于临床医生而言,信息是:解读PSG结果时必须结合具体情境,尤其是在数值接近决策阈值时。对于政策制定者和支付方而言,本研究提出了一个重要问题:如果两种评分系统会将同一患者归入不同类别,那么究竟哪一种更有利于患者照护?未来研究应将可重复性与有意义的临床结局联系起来,但本研究已经清楚表明——OSA如何评分,与测量什么本身同样重要。

资金来源与ClinicalTrials.gov

所提供摘要未说明资金来源或ClinicalTrials.gov登记号。原文未报告注册编号。

参考文献

1. Alavi A, Costa E, Matsumoto MMS, Odenwald N, Kushida C, Bahmani A, Capasso R. Comprehensive Evaluation of Night-to-Night Variability in PSG Metrics and AHI-Based Diagnostic Reclassification. Chest. 2026-06-16. PMID: 42302984.

2. Berry RB, Budhiraja R, Gottlieb DJ, et al. Rules for scoring respiratory events in sleep: update of the 2007 AASM Manual for the Scoring of Sleep and Associated Events. J Clin Sleep Med. 2012;8(5):597-619.

3. Quan SF, Gersh BJ. Cardiovascular consequences of sleep-disordered breathing: past, present and future. Circulation. 2007;116(12):1489-1501.

4. Azarbarzin A, Sands SA, Stone KL, et al. The hypoxic burden of sleep apnoea predicts cardiovascular disease-related mortality: the Osteoporotic Fractures in Men Study and the Sleep Heart Health Study. Eur Heart J. 2019;40(14):1149-1157.

5. Malhotra A, Jordan AS. Impact of hypoxic burden metrics in sleep apnea: moving beyond the apnea-hypopnea index. Lancet Respir Med. 2020;8(7):668-670.

Comments

No comments yet. Why don’t you start the discussion?

发表回复