早发2型糖尿病风险预警研究进展
摘要
关键词
早发2型糖尿病 风险预警模型 中医
正文
糖尿病是当代最广泛流行的疾病之一,传统认为2型糖尿病是中老年人常见病,但研究发现确诊糖尿病的年龄却在逐年提前,年轻化趋势明显[1]。美国糖尿病学会(ADA)将年龄<40岁的2型糖尿病定义为早发2型糖尿病[2],这种诊断年龄的界定在我国的调查研究中也得到了广泛的应用。据2021年国际糖尿病联盟(IDF)公布的糖尿病版图显示,我国早发T2DM的患病率为3.8%[3]。研究发现早发T2DM较晚发T2DM(年龄>40岁的2型糖尿病)具有更高的微血管并发症、心血管疾病及早期死亡风险[4],故尽早识别早发T2DM高危人群,及时采取有效干预措施是预防2型糖尿病发病的关键。疾病风险预测可以对机体的健康状态进行早期风险提示,是实现疾病早期发现、早期预防的主要手段。
1.2型糖尿病风险评估模型研究
风险预测模型是通过参数、半参数或非参数等数学模型,来估算研究对象当前患有特定疾病的概率或者将来发生某种结局的可能性[5]。在医学领域,从1961年弗明翰心脏研究中心提出“风险因素”这一概念,以及专门用于开发医学领域logistic回归建模技术的问世[6],其后疾病的风险预测模型随之兴起,大量的预测模型在不同领域发表,帮助临床医生更准确地评估患者的疾病风险与预后[7]。近些年来国内外研发了多个糖尿病领域的发病模型。
1.1无创模型
(1)芬兰糖尿病危险评分模型(FINDRISC)基于一项大型前瞻性队列研究而构建,是一个用于评估个体在未来10年内罹患2型糖尿病风险的简单、高效的无创性工具。该模型纳入了年龄、BMI、腰围、体力活动、饮食习惯、降压药物治疗史、糖尿病家族史等多个变量,最终筛选出最具预测价值的7个核心指标,建立芬兰个体化糖尿病发病风险评分。通过5年的前瞻性随访验证,得出该模型的受试者曲线下面积(AUC)为0.87[8]。该模型目前仍被认为是全球范围内最有效、最经典且经过广泛验证的2型糖尿病风险评估工具之一。然而Jin[9]在上海居民中应用FINDRISC进行糖尿病筛查,结果显示该评分模型敏感性稍差而特异性较好,分别为44.6%和90.1%,AUC为0.71。其灵敏性及特异性均低于文献报道,这提示需构建适合我国T2DM的风险预测模型。
(2)德国糖尿病风险评分工具(German Diabetes Risk Score),该工具由德国研究者Schwarz[10]等研究者于2008年在德国波茨坦人类营养研究所开发。该评分工具纳入的指标包括年龄、体重、体力活动量、吸烟、饮酒以及红肉、全麦面包、咖啡摄入量等,其最大特点在于将多种生活方式因素进行具体量化,在验证人群中预测性能优异,曲线下面积(AUC)达0.82。该模型具有快速省时、成本极低的优势,且评分包含了许多可改变的生活方式因素,赋予了评分工具的教育性和行动指导意义。在局限性方面,该评分主要通过患者的自我报告来获取临床资料,患者会无意识地高估身高、运动量或健康饮食摄入,低估体重、吸烟等因素,从而导致准确性降低,且该模型缺乏血液指标,可能导致结果出现偏倚[11]。
(3)中国糖尿病风险评分表(NCDRS),其评分表的制定基于2007年至2008年间一项覆盖全国14省、自治区及直辖市的糖尿病流行病学调查数据[12],研究最终纳入了年龄20-74岁的41809名参与者(其中男性16525人,女性25284人) ,通过多元logistic回归模型算法,研究团队建立了中国糖尿病风险评分模型。该模型包含年龄、性别、腰围、体质指数(BMI)、平均收缩压和糖尿病家族史共6个指标,得分范围0~51分。研究确定最佳切点值为25分,将评分<25分者划为“低风险组”, ≥25分者划为“高风险组”。其受试者工作曲线下面积为0.748(95%置信区间:0.739-0.756)。该模型采用青岛的两项研究进行验证[13],包括2006-2009年的前瞻性随访和2009年的横断面研究的外部验证,前者(AUC为0.725)与后者(AUC为0.702)的预测性能均表明,该模型在中国人群中具有良好的区分度。刘媛等人[14]运用该评分表对南昌市15个社区的8714名40岁及以上常住中老年居民进行糖尿病风险评估,其AUC为0.781 (95%CI0.772-0.790) , 使用推荐切点 (25分) 时, 灵敏度和特异度分别为86.5%和49.5%。目前,该模型作为可靠性高、权威性高的糖尿病风险初筛工具,被广泛地应用于中国地社区糖尿病筛查和公共卫生项目[15]。然而此模型主要针对于2型糖尿病而开发的,是否可以应用于早发2型糖尿病的预测,其灵敏度、特异度如何需要进一步验证。
1.2有创模型
传统的糖尿病风险预警模型主要依赖于无创指标,其简便、高效,适合用于大规模筛查,但其指标具有滞后性及精准度有限的劣势,为了提高预警模型的灵敏度及特异度,模型纳入血糖、血脂、糖化血红蛋白、C肽等有创指标。这些有创指标能直接反映人体内部的生理和病理状态,从而弥补无创模型的不足。目前针对2型糖尿病的有创模型主要分为两大类。
1.2.1基于临床常规有创指标的模型
Hippisley等研究者[16]依托英国大规模的基层医疗Qresearch数据库,采用COX比例风险按模型筛选2型糖尿病发病相关风险因素,构建集年龄、民族、BMI、他汀类药物使用史、妊娠糖尿病史等无创指标及空腹血糖、糖化血红蛋白等有创指标的QDiabetes模型。在验证队列中,三个更新版的QDiabetes模型(A、B、C)均显示出良好的预测能力,A模型为无创模型,而模型B纳入空腹血糖值,模型C纳入HbA1c值,结果显示模型B的AUC最高,女性为0.89,男性为0.87,故模型B被推荐用来识别需要干预和密切随访的患者,但其还尚未在英国以外的地区进行验证。
米生权等人基于2002年中国居民营养与健康状况调查数据,分别构建了适用于20-70岁中国成人糖尿病10年发病风险的简单预测模型和复杂预测模型[17],简单模型纳入的风险因素包括年龄、体重指数、腰围、糖尿病家族史和高血压史,其受试者工作特征曲线下面积(AUC)为0.68,灵敏度及特异度分别为57.9%和71.2%。在此基础上,增加血糖及血脂等常规生化指标后,复杂模型的预测性能显著提升,AUC增至0.81,在最佳切点处的灵敏度和特异度分别提高至74.7%和80.0%。以上研究表明,在预测模型中纳入常规生化指标能够有效提升预测准确性。
1.2.2整合新兴生物标志物及遗传风险评分的预测模型
Eun Seok等研究人员以2005年-2010年韩国三星医学中心的健康体检者数据库为基础[18],通过中长期(中位随访时间约4.5年)前瞻性随访验证,评估了FIB-4指数、NAFLD纤维化评分(NFS)在预测2型糖尿病风险方面的表现,显示FIB-4指数预测2型糖尿病的AUC约为0.7,而NFS的AUC约为0.72,研究结果提示肝纤维化程度可作为糖尿病风险的强力预测因子。
Manson等[19]探索了性激素结合球蛋白(SHBG)与2型糖尿病之间的因果关系,其通过前瞻性巢式病例对照研究后发现,即使调整了体重指数、炎症标志物等多种已知风险因素,SHBG水平与2型糖尿病风险之间存在强烈的负相关,表明SHBG是一个独立的风险预测因子。Perry等[20]亦采用孟德尔随机化方法,提供遗传学证据,强有力证明血液中较高的性激素结合球蛋白水平是2型糖尿病的独立保护因素。然而目前尚未有研究将SHBG整合到2型糖尿病预测模型中,其在未来有望成为T2DM精细化风险预测模型中的重要组成部分。
传统的危险因素可以帮助临床医生进2型糖尿病筛查,加入加权遗传风险评分(GRS)可以使得预测能力更加精确。Lyssenko等[21]利用当时已知的多个T2DM相关的单核苷酸多态性(SNPs),为Framingham心脏研究队列参与者构建遗传风险评分,主要结果显示在仅包含临床风险因素(年龄、性别、BMI、血压、血糖)等基础模型上,加入遗传风险评分后,模型的AUC由原先的0.900增加至0.901,但净重新分类改善指数(NRI)提升10.2%,提示该整合模型能更好地对个体进行风险分层。ZHANG等[22]以北京市房山区745名2型糖尿病患者为研究对象,利用临床采集数据,采用logistic回归分析法构建了三种T2DM发病风险评估模型:仅包含传统危险因素的模型、仅包含遗传风险评分(GRS)的模型,以及结合了传统危险因素与遗传风险评分的综合模型。通过曲线下面积(AUC)评估模型的效能,结果显示:传统危险因素模型的AUC为0.647(95%CI:0.623~0.670) ,GRS模型的AUC为0.579(95%CI:0.554~0.604)。而结合两者的综合模型AUC为0.670(95%CI:0.647~0.693)。这表明,在传统危险因素模型的基础上,加入遗传风险评分,能够有效提升模型的预测能力。
2.模型算法
2.1 logistic模型 Logistic回归是一种广义的线性回归分析模型,主要用于研究分类型因变量与自变量之间的影响关系。在医学研究领域,logistic回归已成为探究疾病影响因素和评估疾病发生风险的标准统计工具之一。根据不同的研究设计与数据结构,通常可将Logistic回归分为无条件logistic回归、条件logistic回归、多水平logistic回归。其中无条件logistic回归适用于独立样本的调查研究,通过最大似然估计直接建模,直接估计所有参数的绝对值,输出具有明确流行病学意义的优势比,故多运用于横断面研究和队列研究[23]。目前国内外应用得最多的经典建模方法是通过前瞻性研究,采用非条件logistic回归分析建模[24],通过计算AUC来区分模型预测效能。然而logistic回归易受自变量多重共线性影响,会致使系数估计不稳定和标准误膨胀,故无法有效地区分各个自变量之间可能存在的交互效应。
2.2 COX模型 COX模型,又称比例风险模型,用于分析多个因素(自变量)对生存时间(因变量)的影响[25]。与参数模型相比,该模型对生存时间的分布无固定要求,故多用于疾病的死亡预测、生存分析、疗效评价等方面。有研究[26]利用回顾性队列研究的方法,以2019年至2022年诊断为DKD的住院患者为对象,采用COX比例风险回归模型的建模方法,建立融合尿蛋白定量、血沉等危险因素的糖尿病肾病风险预警工具,其评分为0.794(95%CI 0.727~0.861),证明此模型的预测效能较好。然而COX模型假设各危险因素的作用不随时间变化而变化且假设结果是协变量的线性组合,假设性过强,不涉及变量之间的相互作用,并不能准确衡量它们对某个目标值的影响[27],故在预测像糖尿病等多机制的病理机制及发病过程可能会过于简单。
2.3 随机森林模型 随机森林(RF)是由Leo Breiman于2001年提出的一种集成学习算法,通过集合多个决策树分类器来完成分类或回归任务[28]。其基本原理与决策树相似,具有预测精度高、抗过拟合能力强、可提供内在的特征重要性等优点,与仅依赖单一模型进行拟合的Logistic回归相比,随机森林做出评估的结果通常更为稳健。因此,不少国内外学者也将RF算法应用于疾病预测模型的建立。然而,随机森林模型在可解释性方面存在一定的局限,无法给出各影响因素的相对危险度估计值及其作用方向。
3.构建早发2型糖尿病中医风险预警模型
3.1构建早发2型糖尿病中医风险预警模型的需求
疾病风险评估模型是疾病防控研究热点,糖尿病风险预警模型不断涌现,为糖尿病的防治提供了丰富的理论基础和技术手段。一些研究调查了T2DM患者的诊断年龄和长期并发症之间的关系[29],发现诊断年龄越小,早期患并发症的风险越大,这表明年龄在诊断时具有更多的临床意义,超出了衰老过程本身。早发T2DM患者在早期进行干预,可显著延缓糖尿病进展,降低并发症风险。近年来,多项研究均表明体质与糖尿病的发生发展密切相关[30],有研究通过横断面研究方法,探讨早发T2DM患者的体质分布特征,以及不同体质类型与胰岛β细胞功能之间的关联[31],结果表明,太阴体质、厥阴体质、阳明体质类型是早发T2DM的风险因素。尽管研究证实体质等中医元素与早发T2DM的发生、发展、转归有关,但尚未纳入早发T2DM风险预警模型中。故有必要建立早发2型糖尿病风险评估模型,以充分发挥中医治未病的理论和技术优势。
3.2早发2型糖尿病风险因素的确定
风险因素的确立是风险预警模型的关键问题。从疾病预测的角度出发,寻找可干预、可转变的风险因素才是建立风险预警模型的初衷,目前大部分糖尿病的风险预警模型均以年龄、性别、家族史、高血压、腹围、血脂等作为风险因素,其中一大半的因素如年龄、性别、家族史均为不可干预的因素,而腹围、高血压、血脂等因素与环境、生活方式、习惯等密切相关,还需进一步确立原因,故有必要寻找更为有效的干预因素。
李灿东团队构建了以“状态”为核心的健康认知理论框架[32],该框架以宏观、中观、微观三个层面建立了健康状态的表征参数体系,并据此开发了人体健康状态辨识与干预效果评价系统,其中即包含了针对健康状态的模型算法。其所著的《中医状态学》明确提出中医健康状态辨识法通过收集完整而规范的“三观”参数[33],从宏观(季节气候、地域特点、五运六气等)、中观(个体的生理、心理、社会因素)、微观(理化因素、生物学、影像学、遗传基因等)三个层面全面收集相关影响因素,既有传统的“症”内容,又包含现代生物学的“指标”特征,通过计算机系统数据模型计算,将其具体到病位、病性并且赋予直观的数值变化,能对轻、中、重程度进行量化判断。基于上述多层次因素的风险评估,可作为风险评估因素确立的理论框架。相关研究进一步表明[34],将中医证候、证素纳入疾病进展与转归的预测模型,能有效提升预测的准确性。
3.3早发2型糖尿病中医风险预警模型算法的选择
基于中医整体观构建的多源、多维风险评估指标体系,能够更加全面、准确地预测早发T2DM的发病风险。然而,要使其真正具备实用价值,必须首先解决指标特异性、敏感性、权重分配及其与评估结果的关联性等问题[35]。因此,如何构建并选择合适的模型算法,成为建立有效风险预警模型的核心关键。
目前,基于二分类变量分析的多元Logistic回归仍是构建风险预测模型最常用的方法。它能够清晰揭示危险因素与疾病发生之间的关联程度,并通过回归系数量化各因素对结局事件的影响[36]。然而,传统统计模型在处理共线性问题上存在局限,且通常要求数据满足特定分布假设,难以适应多维、非线性风险因素的复杂情况。中医体系中的风险因素,如证候、证型等,往往属于高维非线性信息,如何将此类数据融入预警模型,正是构建中医特色风险评估体系的难点之一。针对这一问题,目前主要有两种解决思路:一是对中医风险因素进行降维处理。例如,李灿东团队[37]提出,所有证候均可用病性要素与病位要素进行表述,通过量化这些要素的程度,可将非线性信息转化为可供线性模型分析的数据形式。二是借助人工智能方法进行建模。人工智能技术能够基于风险因素与健康状态的先验知识,自动学习并量化各因素的影响,对数据形式与表达方式的要求相对宽松。运用决策树、贝叶斯网络、支持向量机等机器学习方法[38]可用于构建预测模型。应当指出,不同建模方法的预测性能各有差异,没有一种算法能适用于所有数据类型。因此,在实际研究中,应根据试验设计、研究目标、数据特征及模型特点,综合比较多种建模策略,从中筛选出表现最优的算法[39]。对于早发T2DM此类受多因素复杂影响的疾病,在建立多源、多维风险指标框架后,既可通过数据预处理运用传统统计方法建模,也可直接采用决策树、贝叶斯网络等对数据结构要求较低的人工智能技术进行建模[40]。最终,通过模型区分度评估、模型校准度检验等模型质量评价手段,可以筛选并优化出性能优良的风险评估模型,从而实现对疾病发生风险的精准预测。
4.小结
早发T2DM的发病率呈逐年上升的趋势,如何快速、准确、及时的对其高危人群进行评估,减轻疾病负担是其防控的重点和难点。风险预警模型可以明确多种危险因素与疾病发生的关系,对疾病的发生风险做出预测,根据风险等级进行针对性地预防和干预,为个性化防治提供重要的基础。关于早发T2DM的风险预警模型研究尚处于起步阶段,早发T2DM风险预警模型尚未构建。故在中医整体观和中医证素辨证理论指导下建立早发2型糖尿病中医风险预警模型,提前把握早发T2DM的危险因素,充分应用中医治未病的方法和技术,有望降低早发T2DM发生风险等级,以期降低糖尿病并发症发病率。
参考文献
[1]WenJun T ,Yimeng X ,Ding N .The Prevalence and Treatment of Diabetes in China From 2013 to2018.[J].JAMA,2022,327(17):1706-1706.
[2]袁慧娟,杨俊朋,邓欣如,等.成人早发2型糖尿病诊治专家共识[J].中华实用诊断与治疗杂志,2022,36(12):1189-1198.
[3]Deng W ,Zhao L ,Chen C , et al.National burden and risk factors of diabetes mellitus in China from 1990 to 2021: Results from the Global Burden of Disease study 2021.[J].Journal of diabetes,2024,16(10):e70012.
[4]Group TS. Effects of metformin, metformin plus rosiglitazone, and metformin plus lifestyle on insulin sensitivity and β-cell function in TODAY[J]. Diabetes care, 2013, 36(6):1749-1757.
[5]谷鸿秋,周支瑞,章仲恒,等.临床预测模型:基本概念、应用场景及研究思路[J].中国循证心血管医学杂志,2018,10:1454-1456.
[6]胡宸.应用Logistic回归构建基于证素的CAD ,Mara N ,Félix F C , et al.Machine learning methodologies versus cardiovascular risk scores, in predicting disease risk.[J].BMC medical research methodology,2018,18(1):179.
[7]Jaana L ,Jaakko T .The diabetes risk score: a practical tool to predict type 2 diabetes risk.[J].Diabetes care,2003,26(3):725-31.
[8]Meijnikman A,De B,Verrijken A,et al. Predicting type 2 diabetes mellitus:a comparison between the FINDRISC score and the metabolic syndrome[J].Diabetol Metab Syndr,2018,3(1):10-12.
[9]Jin S,Chen Q,Han X,et al. Comparison of the Finnish diabetes risk score model with the metabolic syndrome in a Shanghai population[J]. Front Endocrinol,2022,13(2):725-731.
[10]Schulze MB,Hoffmann K,Boeing H,et al.An accurate risk score based on anthro pometric,dietary,and lifestyle factors to predict the development of type 2 diabetes[J].Diabetes Care,2007,30:510-515.
[11]文江平,田亚平.2型糖尿病高危人群筛查研究进展[J].国际检验医学杂志,2015,36(18):2711-2713.
[12]G W G ,H Y D ,C Z P , et al.A simple Chinese risk score for undiagnosed diabetes.[J].Diabetic medicine : a journal of the British Diabetic Association,2010,27(3):274-81.
[13]Xianghai Z ,Qing Q ,Linong J , et al.Nonlaboratory-based risk assessment algorithm for undiagnosed type 2 diabetes developed on a nation-wide diabetes survey.[J].Diabetes care,2013,36(12):3944-52.
[14]刘媛,霍亚南,熊昌辉,等.中国糖尿病风险评分表在南昌社区中老年人群糖尿病筛查中的运用及改进[J].江西医药,2019,54(01):3-7+14.
[15]胡浩,孙子林.基层2型糖尿病筛查专家共识[J].全科医学临床与教育,2019,17(08):675-678.
[16]Griffin SJ, Little PS, Hales CN, et al. Diabetes risk score:towards earlier detection of type2
diabetes in general practice [J]. Dil betes Metab Res Rev, 2000, 16:164-171.
[17]米生权.中国成人个体糖尿病发病风险预测模型的建立及验证[D].中国疾病预防控制中心,2011.
[18]Yoosoo C ,Hyun-Suk J ,Eun K Y , et al.Cohort study of non-alcoholic fatty liver disease, NAFLD fibrosis score, and the risk of incident diabetes in a Korean population.[J].The American journal of gastroenterology,2013,108(12):1861-8.
[19]Ding, Eric L,Song, Yiqing,Manson, JoAnn E, et al.Sex Hormone-Binding Globulin and Risk of Type 2 Diabetes in Women and Men.[J].The New England Journal of Medicine,2009,361(12):1152-1163.
[20]B R J P ,N M W ,Claudia L , et al.Genetic evidence that raised sex hormone binding globulin (SHBG) levels reduce the risk of type 2 diabetes.[J].Human molecular genetics,2010,19(3):535-44.
[21]M J M D ,Peter S ,J M P , et al.Genetic risk reclassification for type 2 diabetes by age below or above 50 years using 40 type 2 diabetes risk single nucleotide polymorphisms.[J].Diabetes care,2011,34(1):121-5.
[22]张留伟,李文桓,段芳芳,等.基于环境与遗传风险的2型糖尿病发病风险预测模型的比较[J].中国慢性病预防与控制,2016,24(02):84-88.
[23]施泽阳,王禹毅,孙源,等.中医临床预测模型研究现状及方法进展[J].现代中医临床,2024,31(03):21-27.
[24]Sprent P .An Introduction to Categorical Data Analysis[J].Journal of the Royal Statistical Society: Series A (Statistics in Society),2007,170(4):1178-1178.
[25]绕绍奇,徐天和.中华医学统计百科全书(遗传统计分册)[M].北京:中国统计出版社,2013.
[26]钱漫.糖尿病肾脏疾病预后风险因素分析及基于机器学习的预后模型构建[D].吉林大学,2025.
[27]刘玥,苏海霞,关添元,等.深度学习方法在非线性生存资料中的模拟研究及其应用[J].中国预防医学杂志,2025,26(06):679-687.
[28]黄艳玲,吴小枫,杨嘉永.基于机器学习的糖尿病肾脏病预测模型的研究及应用进展[J].中国卫生标准管理,2025,16(09):194-198.
[29]Nanayakkara N, Ranasinha S, Gadowski A, et al. Age, age at diagnosis and diabetesduration are all associated with vascular complications in type 2 diabetes [J].Journal of Diabetes and Its Complications, 2018, 32 (3) : 279–290.
[30]王明欣.促发肥胖患者血糖升高因素及中医体质的相关性研究[D].中国中医科学院,2020.
[31]刘温华.早发2型糖尿病三阴三阳体质分布与胰岛素抵抗、胰岛β细胞功能相关性研究[D].广州中医药大学,2019.
[32]陈飚.基于中医状态学的社区健康管理体系构建及老年人高血压慢性病管理示范应用[D].福建中医药大学,2022.
[33]李灿东.中医状态学.北京:中国中医药出版社,20169-2733.
[34]吕航,王吴,刘媛,等.基于决策树的中医人格体质对2型糖尿病患者伴发非酒精性脂肪肝病风险的预测研究[J].中国中医基础医学杂志,2017,23(9):1257-1259;
[35]吴长汶.基于中医健康状态评估的慢病风险预警理论与应用研究[D].福建中医药大学,2018.
[36]Agostino RS, Vasan RS,Pencina MJ,et al.General cardiovascular risk profile for use in primary care:the Framingham Heart Study [J.Circulation,2008,117(6):743-753.
[37]辛基梁.基于中医状态学理论的健康状态辨识算法研究[D].福建中医药大学,2020.
[38]陈建新,西广成,王伟,等.数据挖掘分类算法在冠心病临床应用的比较[J].北京生物医学工程,2008,(03):249-252.
[39]Tadahiro Goto, Taisuke Jo,Hiroki Matsuia.et al. Machine Learning-Based Prediction Models for 30-Day Readmission after Hospitalization for Chronic Obstructive Pulmonary Disease[J].COPD,2019, 16:33 8-343.
[40]贺婷,袁丽,杨小玲,等.亚洲2型糖尿病发病风险预测模型的系统评价[J].中国全科医学,2022,25(34):4267-4277.
作者简介:
丁伟聪(1999),男,回族,福建晋江,本科学历,研究方向主要从事:内分泌与代谢性疾病
...