
一、研究背景与研究目标
全球2型糖尿病患病率持续攀升,世卫组织预测2035年糖尿病患者将增至5.92亿,发展中国家为高发区域。2型糖尿病起病隐匿、临床表现复杂,常与高血压、高血脂、肥胖等慢病共存,基层非内分泌专科医师缺乏标准化诊断工具,极易出现漏诊、误诊;同时现有临床决策支持系统(CDSS)分为纯专家规则模型与纯机器学习黑盒模型两类,前者受医师主观经验局限、覆盖病例有限,后者可解释性差、临床落地阻力大,难以兼顾诊断精准度与临床可信度。在此背景下,本文作者团队提出融合专家知识与机器学习的混合式人工智能临床决策支持系统(AI-CDSS),旨在解决基层糖尿病诊断能力不足、传统CDSS精度与可解释性失衡的行业痛点。
该研究核心目标分为三层:第一,构建专家知识+机器学习双驱动混合模型(精细化临床知识模型),整合内分泌专科指南与真实患者临床数据;第二,基于回顾性患者数据集完成模型训练与内部验证,对比纯专家、纯机器学习与混合模型的诊断效能;第三,开展门诊前瞻性试点研究,将AI-CDSS与非内分泌专科医师、内分泌专家诊断结果比对,量化系统临床实用价值,验证其在专科资源匮乏地区的替代辅助作用。研究严格遵循美国糖尿病协会糖尿病诊断标准,以糖化血红蛋白(HbA1c)、空腹血糖、体重指数(BMI)三大核心指标为模型核心特征。

二、系统构建技术框架与实现流程
整套AI-CDSS分为六大标准化步骤,形成完整建模、训练、验证闭环,全部采用白盒树状算法,保障诊断逻辑可追溯。
1、数据采集与预处理:研究总样本1298例,划分训练集650例、测试集648例,采集人口学、体格检查、生化检验、家族史 14 类临床指标。采用标准化公式归一化特征,均值填充法处理缺失数据,消除指标量纲差异,保证算法稳定训练。
2、专家知识建模:邀请资深内分泌专家梳理糖尿病分级诊断标准,转化为决策树知识模型,划分四类诊断结局:确诊2型糖尿病、糖尿病前期、高危人群、无糖尿病,纳入家族病史、血压、血脂等辅助判断维度,构建纯规则基线模型。
3、机器学习规则挖掘:对比决策树、随机森林、卡方自动交互检测、分类回归树四类算法,通过递归特征消除筛选关键变量,建立综合评分公式(兼顾准确率、规则数量、特征维度),最终选定分类回归树作为最优算法。该算法仅依靠HbA1c、空腹血糖、BMI三项核心指标即可完成分级预测,计算轻量化,适配基层低算力设备。
4、混合模型融合:设置权重系数整合专家决策树与机器学习预测模型,弥补纯专家模型病例覆盖不全、纯算法脱离临床诊疗逻辑的缺陷,生成最终精细化临床知识模型。
5、模型分层验证:采用分层抽样保证训练、测试集病例分布一致,以准确率、灵敏度、特异度、科恩卡帕系数作为评价指标,量化模型与专家诊断一致性。
6、真实世界门诊试点:连续纳入105名疑似糖尿病门诊患者,剔除数据缺失样本后开展对照试验,对比普通医师与系统的诊断吻合度。

三、核心实验结果
(一)回顾性数据集模型性能对比
纯专家驱动模型整体诊断准确率91%,纯机器学习模型92%,本文混合式精细化临床知识模型综合准确率达99.0%,四类人群分项精度全面领先:确诊糖尿病99.8%、糖尿病前期99.3%、高危人群99.2、无糖尿病98.8%。混淆矩阵数据显示混合模型假阳性、假阴性数量大幅降低,特异度0.99、灵敏度0.94,兼顾筛查灵敏度与诊断特异性。特征筛选实验证实BMI、空腹血糖、糖化血红蛋白是区分糖代谢异常的核心指标。分层年龄亚组分析显示系统在20–100岁全年龄段诊断精度无明显波动。
(二)专科对照与门诊前瞻性试验
648例测试样本中,混合AI-CDSS与内分泌专科医师诊断吻合度达 98.8%;105例门诊试点队列里,45%受试者确诊2型糖尿病,普通非内分泌医师诊断一致率仅85%,AI系统吻合度高达98.5%。针对糖尿病前期、无症状高危这类易漏诊群体,普通医师识别短板突出,系统筛查优势显著。同时对比完整数据集与仅三项核心指标的精简数据集,精简方案仅小幅降低吻合度,证明轻量化部署具备落地可行性。
(三)病例基线统计学差异
糖尿病组与健康对照组各项指标均存在显著统计学差异(P<0.001):糖尿病人群年龄、男性占比、糖尿病家族史、BMI、空腹血糖、糖化、血压、甘油三酯、腰围显著更高,高密度脂蛋白、运动与均衡饮食依从性更低,多饮多尿典型症状发生率远高于健康人,指标区分度充足,支撑模型稳定判别。

四、讨论与创新价值
传统糖尿病CDSS存在固有短板:纯专家系统高度依赖医师主观经验,标准化程度不足;深度学习黑盒模型诊断逻辑无法解释,临床医师接受度低。本研究混合白盒模型实现双向互补:机器学习从海量病历挖掘量化规律,弥补专家经验局限性;专科临床准则约束算法输出,规避违背医学常识的预测。轻量化分类回归树结构算力需求低,适配社区、乡镇基层医疗机构。
临床层面,该系统精准解决基层专科医师短缺难题,可标准化开展糖代谢分层筛查,实现糖尿病早识别、早干预,降低肾病、眼底病变、心血管等远期并发症,长期减轻慢病医疗负担。同时整套决策流程可视化,无算法黑箱,易于嵌入现有电子病历系统,临床落地阻力小。
研究存在局限:数据集人群单一,未纳入1型、妊娠期糖尿病样本;仅完成横断面诊断验证,暂未拓展长期血糖管理、并发症预测模块。未来可扩充多地域多样本数据库,联动穿戴设备搭建动态监测体系,构建全域慢病AI诊疗平台。

五、研究结论
本研究搭建融合内分泌专家诊疗经验与分类回归树机器学习算法的混合式临床决策支持系统,依托1298例回顾队列与105例门诊前瞻性样本完成双重验证。相较传统纯专家、纯机器学习系统,该混合模型对糖尿病、糖尿病前期、高危、健康四类人群分级诊断准确率显著提升,诊断结果与内分泌专家高度匹配,诊疗能力远超基层非专科医师。系统仅依靠三项核心检验指标即可实现高精度筛查,轻量化、可解释、易部署,有效填补基层糖尿病诊疗专业资源缺口,为慢病人工智能辅助诊断提供成熟混合建模范式,拥有广阔临床转化与推广前景。



Stop measuring the gap. Start building the bridge. Thinking will not shrink the distance. Action will. 莫再丈量鸿沟,且去筑桥铺路。空想万遍,难缩天涯咫尺;躬行迈步,方抵彼岸青山。早上好!
