添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
The .gov means it’s official. Federal government websites often end in .gov or .mil. Before sharing sensitive information, make sure you’re on a federal government site. The https:// ensures that you are connecting to the official website and that any information you provide is encrypted and transmitted securely. As a library, NLM provides access to scientific literature. Inclusion in an NLM database does not imply endorsement of, or agreement with, the contents by NLM or the National Institutes of Health. Learn more about our disclaimer.
Sheng Wu Yi Xue Gong Cheng Xue Za Zhi. 2021 Apr 25; 38(2): 249–256.
PMCID: PMC9927681

Language: Chinese | English

基于睡眠心率变异性的心血管疾病预测研究

Study on the prediction of cardiovascular disease based on sleep heart rate variability analysis

晔 杨

中国药科大学 理学院(南京 210009), School of Science, China Pharmaceutical University, Nanjing 210009, P.R.China

Find articles by 晔 杨

雪雅 燕

中国药科大学 理学院(南京 210009), School of Science, China Pharmaceutical University, Nanjing 210009, P.R.China

Find articles by 雪雅 燕

凤贞 侯

中国药科大学 理学院(南京 210009), School of Science, China Pharmaceutical University, Nanjing 210009, P.R.China

Find articles by 凤贞 侯

蕾 潘

中国药科大学 理学院(南京 210009), School of Science, China Pharmaceutical University, Nanjing 210009, P.R.China 中国药科大学 理学院(南京 210009), School of Science, China Pharmaceutical University, Nanjing 210009, P.R.China

corresponding author Corresponding author.
侯凤贞,Email: nc.ude.upc@zfuoh 潘蕾,Email: nc.ude.upc@ielnap

其次,给定区间长度 n ,将 equation M4 划分为不重叠的 m 个区间, m N / n 的整数部分。对于划分的每一段序列采用最小二乘法线性拟合出局部趋势 equation M5 ,最后对 equation M6 去除每个区间的局部趋势并计算出序列的均方根,如式(2)所示:

equation M7 随着 n 的变化呈现幂律分布,其中的斜率表示 DFA 指数,本文记为 DFA_alpha,描述了时间序列的粗糙程度,其值越大表明时间序列越光滑。DFA 是一种能够有效地量化嵌入在非平稳时间序列中的长期相关性的有效方法 [ 28 ]

1.3.2. 多尺度熵分析

多尺度熵分析引进了时间尺度因子 τ 的概念,通过构造一系列不同粗粒化程度的时间序列,并计算它们的熵值,以获得原始时间序列在不同尺度下的复杂性测度。其具体计算过程包括粗粒化和熵值计算两个部分。

对于 N 点的时间序列 equation M8 ,粗粒化过程如 图 2 所示 [ 29 ] 。以尺度因子 τ 为长度,依次将原时间序列划分为 N / τ 段不重叠的子序列,这些子序列的均值就形成了 equation M9 在尺度 τ 上的粗粒化序列,记为 equation M10 equation Z-20210324164353

Schematic diagram of coarse granulation

粗粒化示意图

对于每个粗粒化序列,本文分别采用样本熵(sample entropy,SE)和改进的排列熵(modified permutation entropy, MPE)算法来进行熵分析。SE 算法如式(3)~(6)所示 [ 30 ]

将时间序列 equation M11 嵌入到 m 维空间中,该空间中向量如式(3)所示:

对于 m 维空间中的向量 X i m ,计算它与该空间中其他任一向量 X i m 之间的距离,该距离表示为向量中对应维度上元素距离的最大值,如式(4)所示:

然后,对于每一个向量,计算 m 维空间中与之距离小于给定相似容限 r 的向量占比,记为 equation M12 。对于所有向量,计算 equation M13 的均值,记为 equation M14 ,如式(5)所示:

将嵌入空间的维数增加 1 后重复以上步骤得到 equation M15 ,由此可计算出 SE 值(符号记为 SE ),如式(6)所示:

在本文中,嵌入维 m 取值设定为 2,相似容限 r 的取值设定为 0.15× std std 为原始时间序列的标准差。

具体 PE 算法为 [ 31 ] :在 m 维的嵌入空间中,对每一个 m 维的向量 X i m 中的元素数值大小按升序重新排列,结果中的每个元素在原始序列中的位序作为一个符号记录下来,则得到由 m 个符号构成的一个排列。以 P j 来表示每种可能出现的排列的频率,并计算它们的香农熵,即可得到序列的 PE 值(符号记为 PE ),如式(7)所示:

在 PE 算法中,向量中相等的元素值会被赋予不同的符号。Bian 等 [ 32 ] 提出了 MPE 算法,其中使用相同的符号来表示等值情况。相比 PE 算法,MPE 算法在不同的生理和病理条件下,能够更有效地表征 HRV 信号的复杂性 [ 32 ] 。因此,本文使用 MPE 算法。

本文对每一段 1 h 的 HRV 信号进行了尺度因子从 1 逐一递增至 10 的粗粒化;对于每个粗粒化的序列分别计算了 SE、MPE 值,分别记为 SE1~SE10 和 MPE1~MPE10;同时,还计算了 10 个尺度下 SE、MPE 的均值,分别记为 aver_SE 和 aver_MPE。

1.4. CVD 预测模型构建

本文提出一种两层模型方法来实现 CVD 组和 non-CVD 组的二分类,如 图 3 所示。第一层是基于极端梯度提升算法(extreme gradient boosting,XGBoost)的分类器,用于特征筛选。其输入为某段 HRV 信号的时域特征(SDNN、RMSSD)、频域特征(TP、LF、HF、HFnorm)、非线性动力学特征(DFA_alpha、SE1~SE10、MPE1~MPE10、aver_SE、aver_MPE)以及 11 个临床特征(年龄、BMI、身高、腰臀比、吸烟状况、吸烟频率、是否有高血压病史、是否有糖尿病病史、AHI、RDI、性别),共计 40 个特征。使用基于机器学习库的网格搜索及交叉验证方法来寻找最优分类器 [ 33 ] ,并对其特征重要性进行排序。在第二层模型中,按照上层模型的特征重要性从高到低依次挑选 2~40 的特征,并构建机器学习模型的输入特征空间,建立 CVD 和 non-CVD 分类器。对于机器学习算法的选择,本文考察了 XGBoost、随机森林(random forest,RF)和支持向量机(support vector machine,SVM)三种算法,来寻找分类性能最优的模型。为了提高机器学习模型的泛化能力,每个模型均采用五折交叉验证来划分训练集和测试集,即将整个数据集随机划分为 5 个大小几乎相同的不相交的子集,使用其中 1 折作为测试数据,其余的 4 折作为训练数据,直到所有折都被依次用作测试数据集。最终对 5 轮预测结果求平均值,从而能更合理地评估模型的泛化能力 [ 34 ]

An external file that holds a picture, illustration, etc. Object name is swyxgcxzz-38-2-249-3.jpg
图 3

The proposed framework of CVD prediction

本研究中 CVD 预测模型框架

1.5. 模型性能评价

典型的二分类问题中存在两个类,定义为“正类”和“负类”。实际为正类并且被预测为正类的样本称为“真正类”(true positive,TP)(符号记为 TP ),实际为正类却被预测为负类的样本称为“假负类”(false negative,FN)(符号记为 FN );类似地,实际为负类并且被预测为负类的样本称为“真负类”(true negative,TN)(符号记为 TN ),实际为负类却被预测为正类的样本称为“假正类”(false positive,FP)(符号记为 FP [ 35 - 36 ]

本文将 CVD 组定义为正类,non-CVD 组定义为负类,并使用六个常用指标评估模型预测性能,即:准确率(accuracy,ACC)(符号记为 ACC ),Kappa 系数(符号记为 Kappa ),真阴性率(true negative rate,TNR)(符号记为 TNR ),真阳性率(true positive rate,TPR)(符号记为 TPR ),阳性预测值(positive predictive value,PPV)(符号记为 PPV ),F1 值(F1-Score,F1)(符号记为 F1 ),马修斯相关系数(matthews correlation coefficient,MCC)(符号记为 MCC )。每个指标具体计算方法如式(8)~(14)所示。ACC、Kappa、MCC 常用于综合评价正负类的预测表现,而 TPR、PPV 和 F1 偏向于衡量正类预测表现,TNR 偏向于衡量负类预测表现。

2. 结果与分析

本文利用提出的两层模型方法探索了基于哪一个睡眠段的 HRV 信号分析能更好地预测 CVD 的问题。如 表 1 所示,以五折交叉验证的 ACC 值作为比较标准,列出了利用不同睡眠段 HRV 构建的最优模型的分类性能。使用睡眠段 5,第二层模型采用 XGBoost 算法,使用 13 个输入特征,可以得到正负类综合预测性能最高的模型,其 ACC 值为 84.3%,Kappa 系数为 0.686,MCC 值为 0.689,表示模型的预测值与真实值之间有高度的一致性。 表 1 的结果表明,相比其他睡眠时段,觉醒前 HRV 在预测 CVD 事件上具有更高价值。

表 1

Prediction performance of models in different sleep segments

不同睡眠段模型预测性能

睡眠段 第二层模型算法 特征筛选个数 ACC(%) Kappa TNR(%) TPR(%) PPV(%) F1(%) MCC
睡眠段 1 SVM 6 83.6 0.671 81.4 85.7 82.3 83.9 0.674
睡眠段 2 SVM 11 82.1 0.643 68.6 95.7 75.6 84.4 0.668
睡眠段 3 RF 6 81.4 0.629 80.0 82.9 80.7 81.6 0.632
睡眠段 4 XGBoost 6 82.9 0.657 78.6 87.1 80.9 83.7 0.664
睡眠段 5 XGBoost 13 84.3 0.686 84.3 84.3 84.4 84.2 0.689

图 4 所示,进一步展示了利用不同睡眠段 HRV 构建的最优模型的特征重要性图。对于睡眠段 5,列出了第一层模型中所有特征的重要性排序;而对于睡眠段 1~睡眠段 4,只列出了 ACC 最大情况下筛选出的用于第二层模型的特征。结果显示,无论使用哪一段睡眠数据,年龄与腰臀比都是模型中最重要的特征,这与文献[ 37 ]的报道是吻合的;基于非线性动力学分析的 HRV 指标在各个睡眠段,都有入选。对于睡眠段 3,其 ACC 最低(如 表 1 所示),入选的特征中 HRV 指标较少。而对于睡眠段 5,在筛选特征个数为 13 时 ACC 数值最大,在这一筛选的特征中 HRV 指标占比较高。这一结果可能意味着模型中 HRV 特征重要性的欠缺会导致较低的 CVD 预测正确率。

An external file that holds a picture, illustration, etc. Object name is swyxgcxzz-38-2-249-4.jpg

Feature importance of the 1 st layer model during different sleep segments

不同睡眠段下第一层模型的特征重要性排序

虽然对于各个睡眠段,入选第二层的特征有所不同,如 图 4 所示,但可以发现,基于非线性动力学分析的 MPE1 指标在每一睡眠段中都会出现,SE3 指标也出现在大多数睡眠段中。对于睡眠段 5,如 图 5 所示,组间比较(非配对 t 检验)的结果表明,相对于 non-CVD 组而言,CVD 组的 MPE1 上升,SE3 下降,差异具有统计学意义( P <0.01)。

An external file that holds a picture, illustration, etc. Object name is swyxgcxzz-38-2-249-5.jpg

Values of MPE1 and SE3 indices during sleep segment 5( equation M17

睡眠段 5 的 MPE1 和 SE3 特征值( equation M16

3. 结论

本文提出并采用了一种两层机器学习模型的方法,通过比较利用不同睡眠时期 HRV 特征构建 CVD 预测模型的性能,来探索是否觉醒前的 HRV 更有利于 CVD 事件预测。在正类和负类均衡的情况下,利用觉醒前 HRV 特征构建的预测模型对于 CVD 组和 non-CVD 组的分类准确率最高,达 84.3%。这一结果表明,与其他睡眠段 HRV 相比,觉醒前 HRV 能更准确地预测 CVD 事件。同时,通过对比不同睡眠段 HRV 构建的最优模型的特征重要性排序图,发现 CVD 预测正确率的高低与 HRV 特征重要性占比有关,而 HRV 分析的欠缺可能会导致较低的 CVD 预测正确率。

本研究也表明,夜间睡眠时 HRV 信号的非线性动力学分析也许能更好地捕捉心血管系统潜在的危险。相对于 non-CVD 组,CVD 组在觉醒前 HRV 上,MPE1 和 SE3 都出现了显著的变化。此外,虽然对于各个不同时期的睡眠段,各 HRV 分析指标在模型中的重要性有所不同,但非线性动力学指标 MPE1、SE3 在各睡眠段中均展现出了较高的特征重要性,意味着它们对 CVD 的预测较为重要。本文研究结果进一步证实了心脏动力系统具有非线性特性,在构建 CVD 预测模型时,应综合 HRV 的线性与非线性动力学指标,才能更好地评估潜在的生理过程。

利益冲突声明:本文全体作者均声明不存在利益冲突。

Funding Statement

国家自然科学基金(61401518)

References

1. World Health Organization. Cardiovascular diseases. (2017-5-17)[2020-3-30]. https://www.who.int/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds).
2. Clark H NCDs: a challenge to sustainable human development. Lancet. 2013; 381 (9866):510–511. doi: 10.1016/S0140-6736(13)60058-6. [ PubMed ] [ CrossRef ] [ Google Scholar ]
3. de Zambottim, Trinder J, Silvani A, et al Dynamic coupling between the central and autonomic nervous systems during sleep: A review. Neurosci Biobehav Rev. 2018; 90 :84–103. doi: 10.1016/j.neubiorev.2018.03.027. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
4. Thayer J F, Yamamoto S S, Brosschot J F The relationship of autonomic imbalance, heart rate variability and cardiovascular disease risk factors. Int J Cardiol. 2010; 141 (2):122–131. doi: 10.1016/j.ijcard.2009.09.543. [ PubMed ] [ CrossRef ] [ Google Scholar ]
5. Manfredini R, Boari B, Salmi R, et al Twenty-four-hour patterns in occurrence and pathophysiology of acute cardiovascular events and ischemic heart disease. Chronobiol Int. 2013; 30 (1-2):6–16. doi: 10.3109/07420528.2012.715843. [ PubMed ] [ CrossRef ] [ Google Scholar ]
6. Goff E A, Nicholas C L, Simonds A K, et al Differential effects of waking from non-rapid eye movement versus rapid eye movement sleep on cardiovascular activity. J Sleep Res. 2010; 19 (1):201–206. [ PubMed ] [ Google Scholar ]
7. Muller J E, Ludmer P L, Willich S N, et al Circadian variation in the frequency of sudden cardiac death. Circulation. 1987; 75 (1):131–138. doi: 10.1161/01.CIR.75.1.131. [ PubMed ] [ CrossRef ] [ Google Scholar ]
8. Willich S N, Levy D, Rocco M B, et al Circadian variation in the incidence of sudden cardiac death in the framingham heart study population. Am J Cardiol. 1987; 60 (10):801–806. doi: 10.1016/0002-9149(87)91027-7. [ PubMed ] [ CrossRef ] [ Google Scholar ]
9. Thakur R K, Hoffmann R G, Olson D W, et al Circadian variation in sudden cardiac death: effects of age, sex, and initial cardiac rhythm. Ann Emerg Med. 1996; 27 (1):29–34. doi: 10.1016/S0196-0644(96)70292-5. [ PubMed ] [ CrossRef ] [ Google Scholar ]
10. Wang Q, Cui Y, Yogendranath P, et al Blood pressure and heart rate variability are linked with hyperphosphatemia in chronic kidney disease patients. Chronobiol Int. 2018; 35 (10):1329–1334. doi: 10.1080/07420528.2018.1486850. [ PubMed ] [ CrossRef ] [ Google Scholar ]
11. Takeda N, Maemura K Circadian clock and the onset of cardiovascular events. Hypertens Res. 2016; 39 (6):383–390. doi: 10.1038/hr.2016.9. [ PubMed ] [ CrossRef ] [ Google Scholar ]
12. Amici A, Cicconetti P, Sagrafoli C, et al Exaggerated morning blood pressure surge and cardiovascular events. A 5-year longitudinal study in normotensive and well-controlled hypertensive elderly. Arch Gerontol Geriat. 2009; 49 (2):e105–e109. [ PubMed ] [ Google Scholar ]
13. van de Borne P, Nguyen H, Biston P, et al Effects of wake and sleep stages on the 24-h autonomic control of blood pressure and heart rate in recumbent men. Am J Physiol. 1994; 266 (2):H548–H554. [ PubMed ] [ Google Scholar ]
14. Furlan R, Guzzetti S, Crivellaro W, et al Continuous 24-hour assessment of the neural regulation of systemic arterial-pressure and RR variabilities in ambulant subjects. Circulation. 1990; 81 (2):537–547. doi: 10.1161/01.CIR.81.2.537. [ PubMed ] [ CrossRef ] [ Google Scholar ]
15. 黄晓林. 心率变异性的分析方法研究. 南京: 南京大学, 2009.
16. Pumprla J, Howorka K, Groves D, et al Functional assessment of heart rate variability: physiological basis and practical applications. Int J Cardiol. 2002; 84 (1):1–14. doi: 10.1016/S0167-5273(02)00057-8. [ PubMed ] [ CrossRef ] [ Google Scholar ]
17. Kirizawa J M, Garner D M, Arab C, et al Is heart rate variability a valuable method to investigate cardiac autonomic dysfunction in subjects with leukemia? A systematic review to evaluate its importance in clinical practice. Support Care Cancer. 2020; 28 (1):35–42. doi: 10.1007/s00520-019-05047-x. [ PubMed ] [ CrossRef ] [ Google Scholar ]
18. Escorihuela R M, Capdevila L, Castro J R, et al Reduced heart rate variability predicts fatigue severity in individuals with chronic fatigue syndrome/myalgic encephalomyelitis. J Transl Med. 2020; 18 (1):4. doi: 10.1186/s12967-019-02184-z. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
19. Endukuru C K, Gaur G S, Yerrabelli D, et al Impaired baroreflex sensitivity and cardiac autonomic functions are associated with cardiovascular disease risk factors among patients with metabolic syndrome in a tertiary care teaching hospital of South-India. Diabetes Metab Syndr. 2020; 14 (6):2043–2051. doi: 10.1016/j.dsx.2020.10.018. [ PubMed ] [ CrossRef ] [ Google Scholar ]
20. Kubota Y, Chen L Y, Whitsel E A, et al Heart rate variability and lifetime risk of cardiovascular disease: the atherosclerosis risk in communities study. Ann Epidemiol. 2017; 27 (10):619–625. doi: 10.1016/j.annepidem.2017.08.024. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
21. Cardoso C L, Moraes R M, Leite N C, et al Relationships between reduced heart rate variability and pre-clinical cardiovascular disease in patients with type 2 diabetes. Diabetes Research and Clinical Practice. 2014; 106 (1):110–117. doi: 10.1016/j.diabres.2014.07.005. [ PubMed ] [ CrossRef ] [ Google Scholar ]
22. Yan X, Zhang L, Li J, et al Entropy-based measures of hypnopompic heart rate variability contribute to the automatic prediction of cardiovascular events. Entropy (Basel) 2020; 22 (2):241. doi: 10.3390/e22020241. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
23. Quan S F, Howard B V, Iber C, et al The sleep heart health study: design, rationale, and methods. Sleep. 1997; 20 (12):1077–1085. [ PubMed ] [ Google Scholar ]
24. Pan J, Tompkins W J A real-time QRS detection algorithm. IEEE Trans Biomed Eng. 1985; 32 (3):230–236. [ PubMed ] [ Google Scholar ]
25. Lippman N, Stein K M, Lerman B B Comparison of methods for removal of ectopy in measurement of heart rate variability. Am J Physiol. 1994; 267 (1):H411–H418. [ PubMed ] [ Google Scholar ]
26. Camm A J, Malik M, Bigger J T, et al Heart rate variability-standards of measurement, physiological interpretation, and clinical use. Circulation. 1996; 93 (5):1043–1065. doi: 10.1161/01.CIR.93.5.1043. [ PubMed ] [ CrossRef ] [ Google Scholar ]
27. 杨萍, 侯威, 封国林 基于去趋势波动分析方法确定极端事件阈值 物理学报 2008; 57 (8):5333–5342. doi: 10.3321/j.issn:1000-3290.2008.08.105. [ CrossRef ] [ Google Scholar ]
28. Li R X, Wang J, Chen Y Y Effect of the signal filtering on detrended fluctuation analysis. Physica A. 2018; 494 :446–453. doi: 10.1016/j.physa.2017.12.011. [ CrossRef ] [ Google Scholar ]
29. Costa M, Goldberger A L, Peng C K Multiscale entropy analysis of complex physiologic time series. Phys Rev Lett. 2002; 89 (6):068102. doi: 10.1103/PhysRevLett.89.068102. [ PubMed ] [ CrossRef ] [ Google Scholar ]
30. Richman J S, Moorman J R Physiological time-series analysis using approximate entropy and sample entropy. Am J Physiol Heart Circ Physiol. 2000; 278 (6):H2039–H2049. doi: 10.1152/ajpheart.2000.278.6.H2039. [ PubMed ] [ CrossRef ] [ Google Scholar ]
31. Bandt C, Pompe B Permutation entropy: a natural complexity measure for time series. Phys Rev Lett. 2002; 88 (17):4. [ PubMed ] [ Google Scholar ]
32. Bian Chunhua, Qin Chang, Ma Q D, et al Modified permutation-entropy analysis of heartbeat dynamics. Phys Rev E Stat Nonlin Soft Matter Phys. 2012; 85 (2):021906. doi: 10.1103/PhysRevE.85.021906. [ PubMed ] [ CrossRef ] [ Google Scholar ]
33. 宋小锋 基于决策树的空气质量建模 电子测试 2020; 11 (11):67–68, 59. doi: 10.3969/j.issn.1000-8519.2020.11.023. [ CrossRef ] [ Google Scholar ]
34. Cawley G C, Talbot N L C On over-fitting in model selection and subsequent selection bias in performance evaluation. J Mach Learn Res. 2010; 11 :2079–2107. [ Google Scholar ]
35. Luque A, Carrasco A, Martin A, et al The impact of class imbalance in classification performance metrics based on the binary confusion matrix. Pattern Recogn. 2019; 91 :216–231. doi: 10.1016/j.patcog.2019.02.023. [ CrossRef ] [ Google Scholar ]
36. Sokolova M, Lapalme G A systematic analysis of performance measures for classification tasks. Inf Process Manage. 2009; 45 (4):427–437. doi: 10.1016/j.ipm.2009.03.002. [ CrossRef ] [ Google Scholar ]
37. Zhang L, Wu H L, Zhang X Y, et al Sleep heart rate variability assists the automatic prediction of long-term cardiovascular outcomes. Sleep Med. 2020; 67 :217–224. doi: 10.1016/j.sleep.2019.11.1259. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]

Articles from Sheng Wu Yi Xue Gong Cheng Xue Za Zhi = Journal of Biomedical Engineering are provided here courtesy of West China Hospital of Sichuan University