2. 桂平市人民医院, 广西桂平 537200;
3. 广西医科大学第二附属医院, 广西南宁 530007
2. Guiping People's Hospital, Guiping, Guangxi, 537200, China;
3. The Second Affiliated Hospital of Guangxi Medical University, Nanning, Guangxi, 530007, China
脑卒中是全球排名第二的致死性疾病,我国每年每10万人中有340例以上患者因其死亡[1]。急性缺血性脑卒中(Acute Ischemic Stroke,AIS)是脑卒中最主要的临床亚型,我国AIS住院患者病死率或致残率高,分别达34.5%和37.1%[2]。AIS患者最佳治疗方案是在溶栓时间窗内(发病至溶栓时间 < 6 h)行静脉溶栓,但据我国国家卒中登记数据库数据显示,我国AIS患者静脉重组组织型纤溶酶原激活剂(Recombinant Tissue Plasminogen Activator,rt-PA)溶栓率仅为1.23%[3]。可见,绝大部分AIS患者未能静脉溶栓。对于溶栓的AIS患者,其预后的影响因素较多,如血管再通情况、基础疾病等[4];另外,人工神经网络(ANN)可有效地预测AIS患者预后,并识别出影响预后的关键因素[5]。但对于占比更高的未能溶栓的AIS患者,其预后影响因素的相关报道,尤其是使用机器学习或人工智能方法对患者预后进行预测的研究较少。因此,本研究通过回顾性研究AIS患者入院时的临床资料并结合机器学习分类(Classification)算法,对AIS患者短期预后进行研究,以尽早识别不良预后的高风险患者,为及早干预并改善预后提供科学依据。
1 材料与方法 1.1 研究对象选择2019年1月至2023年3月在我院神经内科住院治疗的AIS患者774例。纳入标准:(1)符合AIS诊断标准(采用中华医学会制定的《中国急性缺血性脑卒中诊治指南2018》[6]);(2)发病时间 > 6 h;(3)未行静脉溶栓治疗患者。排除标准:(1)伴精神疾病、依从性差无法配合患者;(2)多发梗死昏迷患者;(3)伴遗传代谢性疾病、血液系统疾病患者;(4)伴重度心、肝、肾、肺功能障碍,多器官功能损伤及凝血功能障碍患者;(5)伴恶性肿瘤、颅脑外伤、颅内感染患者;(6)临床资料不全患者;(7)发病至入院时间(患者出现AIS症状至入院时间) > 2周;(8)患者年龄 > 90岁。
1.2 资料收集收集患者入院时(治疗前)的临床资料,包括性别、年龄、身体质量指数(Body Mass Index,BMI)、美国国立卫生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)评分、格拉斯哥昏迷(Glasgow Coma Scale,GCS)评分、发病-治疗时间(h)、梗死灶体积(CT诊断,mm3)、2型糖尿病史(TMD2)、高血压史、卒中史、心绞痛史、心梗史、房颤史、现病史≥3种、血白细胞(WBC)计数、血中性粒细胞计数(NEU)、血淋巴细胞计数(LYM)、血中性粒细胞/淋巴细胞比值(NLR)、血单核细胞计数(MON)、血小板计数(PLT)、凝血酶原时间(PT)、低密度脂蛋白(LDL)水平、高密度脂蛋白(HDL)水平、HDL-LDL比值、血总胆固醇(TC)水平、血甘油三酯(TG)水平、血清总胆红素(T-BIL)水平、血C反应蛋白(C-Reactive Protein,CRP)水平、血半胱氨酸(Cysteine,CYS)水平。
1.3 预后评价随访至出院90 d,根据改良Rankin量表(modified Rankin Scale,mRS)界定短期预后是否良好:残疾(mRS≥3分)或死亡为预后不良;mRS < 3分为预后良好。
1.4 统计学方法计量资料以均数±标准差表示,非正态分布计量资料则以中位数[四分位数间距, M(P25,P75)]表示,计数资料以例数(百分比)表示。组间连续性资料比较采用t检验(正态分布,方差齐)或非参数检验(Mann-Whitney检验),分类资料采用卡方检验或Fisher’s精确检验。P < 0.05为差异显著,表示有统计学意义。
1.5 机器学习建模使用Python编程语言(3.10),使用的库主要包括NumPy(1.23.5)、Pandas(2.1.1),机器学习方法使用PyCaret[7](PyCaret 3.0,使用方法详见网址https://pycaret.org/)。将50%数据划分为训练样本(用于模型构建),余下50%数据为验证样本(用于模型评估)。建模前对数据进行预处理,对连续型资料(数值型变量)进行归一化(Normalization)处理,对计数资料(分类变量)进行哑变量处理。利用受试者工作特征曲线(ROC)计算曲线下面积(Area Under Curve,AUC)来判断模型的诊断准确性,使用校准图(Calibration plot)评估预测风险与实际发生风险的一致性。
2 结果与分析 2.1 预后良好与预后不良的AIS患者临床资料比较研究结果显示,774例患者中,3个月随访期内预后良好患者占比86.05%(666例),预后不良患者占13.95%(108例)。组间比较显示,预后良好与预后不良患者在入院时年龄、血WBC计数、血CRP水平、血TG水平、NIHSS评分、GCS评分、梗死灶体积和发病-治疗时间上均差异显著(P < 0.05,表 1)。
变量名 Variable name |
预后良好(n=666) Good prognosis(n=666) |
预后不良(n=108) Poor prognosis (n=108) |
P值 P value |
|
Gender | Female | 307(46.10%) | 49(45.37%) | 0.888 |
Male | 359(53.90%) | 59(54.63%) | ||
Age/a | 60.22 (54.50, 65.29) | 63.91 (58.01, 69.64) | < 0.001 | |
BMI/(kg/m2) | Normal body weight | 257(38.59%) | 44(40.74%) | 0.469 |
Low weight | 36(5.41%) | 2(1.85%) | ||
Overweight | 252(37.84%) | 42(38.89%) | ||
Fat | 121(18.17%) | 20(18.52%) | ||
WBC/(×109/L) | 7.73±2.68 | 7.08±2.38 | 0.012 | |
NEU/(×109/L) | 4.84±1.52 | 4.84±1.67 | 0.997 | |
LYM/(×109/L) | 1.68±0.55 | 1.65±0.60 | 0.617 | |
NLR | 3.16±5.20 | 3.34±1.80 | 0.508 | |
MON/(×109/L) | 0.31±0.10 | 0.33±0.10 | 0.147 | |
PLT/(×109/L) | 220.28±7.14 | 219.51±7.27 | 0.302 | |
CRP/(mg/L) | 9.85±3.28 | 12.27±3.70 | < 0.001 | |
PT/s | 13.44±5.63 | 13.31±5.40 | 0.810 | |
LDL/(mmol/L) | 3.52±1.02 | 3.57±1.15 | 0.705 | |
HDL/(mmol/L) | 0.72±0.23 | 0.73±0.24 | 0.636 | |
HDL-LDL ratio | 0.23±0.13 | 0.23±0.14 | 0.614 | |
TC/(mmol/L) | 6.34±2.01 | 6.36±2.16 | 0.937 | |
TG/(mmol/L) | 1.44±0.33 | 1.35±0.30 | 0.008 | |
T-BIL/(mmol/L) | 12.60±3.32 | 12.94±3.52 | 0.359 | |
CYS/(μmol/L) | 14.54±3.87 | 14.14±3.55 | 0.294 | |
National Institutes of Health stroke scale score | 10.00 (8.00, 12.00) | 12.00 (10.00, 14.00) | < 0.001 | |
Glasgow coma scale score | 9.00 (7.00, 11.00) | 8.00 (6.00, 10.00) | < 0.001 | |
Infarct volume/mm3 | 64.97±20.82 | 74.40±26.08 | < 0.001 | |
Onset-treatment time/h | 7.82±0.74 | 8.32±1.20 | < 0.001 | |
Type 2 diabetes | No | 580(87.09%) | 96(88.89%) | 0.601 |
Yes | 86(12.91%) | 12(11.11%) | ||
Hypertension | No | 584(87.69%) | 97(89.81%) | 0.528 |
Yes | 82(12.31%) | 11(10.19%) | ||
Stroke | No | 606(90.99%) | 97(89.81%) | 0.694 |
Yes | 60(9.01%) | 11(10.19%) | ||
Stenocardia | No | 625(93.84%) | 100(92.59%) | 0.620 |
Yes | 41(6.16%) | 8(7.41%) | ||
Myocardial infarction | Yes | 638(95.80%) | 104(96.30%) | > 0.999 |
No | 28(4.20%) | 4(3.70%) | ||
Atrial fibrillation | Yes | 603(90.54%) | 95(87.96%) | 0.404 |
No | 63(9.46%) | 13(12.04%) | ||
History of present illness≥3 kinds | Yes | 651(97.75%) | 103(95.37%) | 0.181 |
No | 15(2.25%) | 5(4.63%) |
2.2 模型构建与评价
本研究采用了目前机器学习中常用的15种分类学习算法,结果显示极限梯度提升(Extreme Gradient Boosting,XGB)模型的AUC数值为0.81(表 2,图 1),排在第一,比其他分类算法的AUC值高(表 2)。XGB模型是一种基于决策树的集成学习算法,能有效处理数据中的异常值和缺失值,并通过正则化项和早停策略等技术有效地防止模型过拟合,提高了模型的泛化能力。根据XGB模型输出预测变量影响权重(图 2),筛选的预测变量影响权重居前6位的依次为发病-治疗时间、血CRP水平、年龄、梗死灶体积、血TG水平与NIHSS评分。为评估模型拟合情况,通过校准图对预后不良患者组进行校准,结果显示图中校准线距离理想参考线(图中虚线)较近,表明模型拟合性能稳健,模型评估预测风险与实际发生风险的一致程度高(图 3)。
模型名称 Model name |
准确率 Accuracy |
曲线下面积 AUC |
召回率 Recall |
精确率 Precision |
F1分数 F1 score |
卡帕系数 Kappa |
Extreme Gradient Boosting (XGB) | 0.87 | 0.81 | 0.28 | 0.78 | 0.41 | 0.35 |
Light Gradient Boosting (LGB) | 0.86 | 0.80 | 0.32 | 0.63 | 0.40 | 0.34 |
CatBoost classifier | 0.86 | 0.79 | 0.35 | 0.68 | 0.43 | 0.37 |
Random forest | 0.84 | 0.78 | 0.11 | 0.35 | 0.16 | 0.13 |
Extra trees classifier | 0.83 | 0.78 | 0.02 | 0.10 | 0.03 | 0.02 |
Gradient boosting decision tree | 0.85 | 0.77 | 0.32 | 0.55 | 0.39 | 0.31 |
Logistic regression | 0.82 | 0.76 | 0.27 | 0.43 | 0.30 | 0.22 |
Linear discriminant analysis | 0.83 | 0.75 | 0.27 | 0.39 | 0.31 | 0.22 |
AdaBoost classifier | 0.82 | 0.72 | 0.30 | 0.42 | 0.34 | 0.25 |
Naive bayes model | 0.67 | 0.70 | 0.39 | 0.31 | 0.29 | 0.15 |
Decision tree | 0.81 | 0.68 | 0.48 | 0.45 | 0.44 | 0.33 |
k-Nearest neighbor | 0.82 | 0.57 | 0.07 | 0.20 | 0.10 | 0.06 |
Quadratic discriminant analysis | 0.82 | 0.45 | 0.00 | 0.00 | 0.00 | -0.02 |
SVM-Linear kernel | 0.79 | 0.00 | 0.39 | 0.30 | 0.33 | 0.22 |
Ridge regression | 0.83 | 0.00 | 0.21 | 0.47 | 0.28 | 0.21 |
3 讨论
机器学习是目前新颖且热门的人工智能技术,已有不少医学领域的研究将这一方法应用于疾病的诊断以及预后的预测中,并取得了不错的效果[8-10]。本研究利用机器学习分类算法,筛选出对AIS患者短期预后有预测价值的入院临床资料。选择入院时临床资料在于尽早发现患者是否会发生不良预后,当预测不良预后的概率超过50%时,临床医生应提高警惕,并根据患者的具体情况及早干预,以改善预后。
通过比较各种机器学习分类算法发现, XGB模型效果最佳。筛选出的入院临床资料预测变量中,影响权重排名前6位的依次为发病-治疗时间、血CRP水平、年龄、梗死灶体积、血TG水平与NIHSS评分。发病-治疗时间影响权重最大,提示对于未能溶栓的AIS患者,时间窗意义重大,及早治疗可极大地提高病人的存活率,减少致残率,提高病人的生活质量。患者入院时血CRP水平对患者短期预后的影响权重排第二,该指标作为常见的炎症因子,可损伤血管,加重血管局部炎症反应,加重缺血[11],是AIS患者短期预后的独立影响因素[12]。Derbisz等[13]研究也显示,血CRP≥10 mg/L是阿替普酶治疗的AIS患者发病后90 d内死亡的独立影响因子,这些结果提示对超出溶栓时间窗的AIS患者,应密切观察血CRP水平,并积极进行抗炎治疗,以改善患者预后。年龄是影响权重排第三的指标,年龄不只是AIS发病的危险因素,也是该病患者预后的重要影响因素,其具体机制可能在于年龄越大,脑组织损伤后修复能力越差,而且老年人往往存在着其他基础疾病,康复难度更大[14]。关于梗死灶体积对AIS患者的影响,国内学者报道梗死灶体积越大,神经功能缺损程度越高[15],这与本研究结果一致。另外,本研究发现血TG水平对患者预后影响较大,预后不良组患者入院血TG水平显著高于预后良好组患者,提示控制AIS患者的血TG水平有助于改善其预后;但血TG水平对AIS患者预后的影响存在争议,崔琴等[16]研究认为AIS患者的血TG水平是预后的保护性因素,并认为血TG对患者中枢神经有一定保护作用,只是其作用机制尚不清楚,但该研究未用患者数据验证,因此需要进一步研究。作为公认的影响AIS患者预后的指标,本研究建模结果同样认为入院时NIHSS评分对患者预后存在影响。
对于疾病预后的预测方面,机器学习分类算法相比传统的逻辑回归模型可更好地捕捉非线性关系,具有更好的鲁棒性和泛化能力,可更好地处理噪声和缺失值。但机器学习分类算法需对数据进行预处理(归一化和哑变量),结果的可解释性不佳,无法像逻辑回归模型直接量化影响因素的作用(计算OR值),进而判定因素为独立危险因素抑或是保护因素。这就需通过将机器学习分类算法置于基于浏览器的交互界面中,通过输入患者具体指标的数值,计算出预后不良的概率。此外,本研究为单中心研究,例数不够多,纳入的指标也不够全面和细化(如病因分型、梗死部位、肺部感染情况、治疗用药与时间等),由于纳入资料的时间跨度大,某些指标未能使用更为准确的检查方法测量,如梗死灶体积未能用磁共振扩散加权成像(MR DWI)计算,这些都是本研究的局限所在。因此,还需要在多中心研究中纳入更多、更细化的全面指标,继续深入研究,为超出溶栓时间窗的AIS患者预后判断提供临床依据。
4 结论本研究通过应用各种机器学习分类算法,分析静脉溶栓时间窗外AIS患者入院时的临床资料。结果发现,XGB算法表现最佳,显示出较高的预测准确性和可靠性;患者短期预后受发病-治疗时间、血CRP水平、年龄、梗死灶体积、血TG水平与NIHSS评分的显著影响。
[1] |
TU W J, ZHAO Z, YIN P, et al. Estimated burden of stroke in China in 2020[J]. JAMA Network Open, 2023, 6(3): e231455. DOI:10.1001/jamanetworkopen.2023.1455 |
[2] |
GBD 2016 Neurology Collaborators. Global, regional, and national burden of neurological disorders, 1990-2016:a systematic analysis for the global burden of disease study 2016[J]. The Lancet Neurology, 2019, 18(5): 459-480. DOI:10.1016/S1474-4422(18)30499-X |
[3] |
刘琴琴, 杨丽, 赵秋利, 等. 缺血性卒中溶栓就医延迟风险因素研究进展[J]. 中国全科医学, 2019, 22(16): 2000-2007. |
[4] |
JIN M, PENG Q, WANG Y. Post-thrombolysis early neurological deterioration occurs with or without hemorrhagic transformation in acute cerebral infarction: risk factors, prediction model and prognosis[J]. Heliyon, 2023, 9(5): e15620. DOI:10.1016/j.heliyon.2023.e15620 |
[5] |
CHUNG C C, CHAN L, BAMODU O A, et al. Artificial neural network based prediction of postthrombolysis intracerebral hemorrhage and death[J]. Scientific Reports, 2020, 10(1): 20501. DOI:10.1038/s41598-020-77546-5 |
[6] |
中华医学会神经病学分会, 中华医学会神经病学分会脑血管病学组. 中国急性缺血性脑卒中诊治指南2018[J]. 中华神经科杂志, 2018, 51(9): 666-682. |
[7] |
ZHAO Q Y, LIU L P, LUO J C, et al. A machine-learning approach for dynamic prediction of sepsis-induced coagulopathy in critically ill patients with sepsis[J]. Frontiers in Medicine, 2020, 7: 637434. |
[8] |
LE S, PELLEGRINI E, GREEN-SAXENA A, et al. Supervised machine learning for the early prediction of acute respiratory distress syndrome (ARDS)[J]. Journal of Critical Care, 2020, 60: 96-102. DOI:10.1016/j.jcrc.2020.07.019 |
[9] |
AL'REF S J, SINGH G, VAN ROSENDAEL A R, et al. Determinants of in-hospital mortality after percutaneous coronary intervention: a machine learning approach[J]. Journal of the American Heart Association, 2019, 8(5): e011160. DOI:10.1161/JAHA.118.011160 |
[10] |
李惠萍, 胡安民. 机器学习DNN和XGBoost算法对危重患者预后预测模型效能评估[J]. 实用医学杂志, 2020, 36(4): 466-469. |
[11] |
韩雪, 高燕军, 赵士娇. 血清正五聚蛋白3、超敏C反应蛋白水平与急性脑梗死患者的病情严重程度及预后的关系[J]. 卒中与神经疾病, 2019, 26(1): 22-26. |
[12] |
孙娜, 钟丽珍, 赵华, 等. 血清胱抑素C、C-反应蛋白和同型半胱氨酸联合预测脑梗死患者短期预后的价值[J]. 心脑血管病防治, 2021, 21(6): 567-570. |
[13] |
DERBISZ J, NOWAK K, WNUK M, et al. Prognostic significance of stroke-associated infection and other readily available parameters in acute ischemic stroke treated by intravenous thrombolysis[J]. Journal of Stroke and Cerebrovascular Diseases, 2021, 30(2): 105525. DOI:10.1016/j.jstrokecerebrovasdis.2020.105525 |
[14] |
ZHAO Y, HAN Y, SUN W, et al. Clinical symptoms, etiology and prognosis of acute bilateral posterior circulation cerebral infarction[J]. International Journal of General Medicine, 2022, 15: 2787-2793. DOI:10.2147/IJGM.S351560 |
[15] |
郝泽林, 吴建跃, 滕振飞, 等. 急性脑梗死患者血清学指标与神经功能缺损和脑梗死体积及颈动脉斑块性质的相关性研究[J]. 中华全科医学, 2020, 18(11): 1803-1806. |
[16] |
崔琴, 湛彦强, 胡丹, 等. 非空腹甘油三酯与急性脑梗死预后的关系[J]. 神经损伤与功能重建, 2019, 14(11): 547-550. |