推荐:本研究针对糖尿病风险预测中数据集不平衡、特征选择不足等关键问题,采用SMOTE过采样技术和集成学习方法(包括Bagging、Boosting和CATBoost等),在CDC、ESDRP和PIMA三个数据集上构建预测模型。结果显示,CATBoost在CDC数据集上准确率达91%,集成方法在ESDRP数据 ...