糖尿病预测数据集

糖尿病预测数据集 数据来源:互联网公开数据 标签:糖尿病预测,人口统计学,实验室变量,机器学习,分类算法,非洲裔美国人,健康数据分析 数据概述: 本数据集包含了几百名农村非洲裔美国人的实际患者数据,用于预测糖尿病(是或否),通过使用人口统计学和实验室变量。数据集中的diabetes.csv文件包含了所有患者的原始数据,包括存在缺失值的情况,可用于进行描述性统计分析。Diabetes_Classification文件经过清理和处理,排除了没有血红蛋白A1c数据的患者。如果患者的血红蛋白A1c值达到6.5或更高,则被标记为糖尿病=是。在总共390名患者中,有60名被诊断为糖尿病。数据集中包含了一个变量代码簿,详细说明了各个变量的含义。该数据集的目标是使用机器学习的分类算法来预测糖尿病的发生,并找出最强的预测因子。此外,数据集还探讨了排除葡萄糖数据后预测的强度。 数据用途概述: 该数据集适用于糖尿病预测研究、人口统计学分析、实验室数据分析以及机器学习算法的开发。研究人员可以利用此数据来探索糖尿病预测的最佳方法,确定最强的预测因子;医疗机构可以使用预测模型来辅助诊断和治疗;教育工作者和学生可以通过该数据集学习机器学习和健康数据分析的方法和技巧。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 06:19 (UTC)
创建于 四月 15, 2025, 06:19 (UTC)