香港科技大学2023春季学期人工智能课程期中考试-卒中风险预测数据集
数据来源:互联网公开数据
标签:人工智能,机器学习,二元分类,卒中,健康,医疗,风险预测,教育,香港科技大学
数据概述:
本数据集是香港科技大学2023年春季学期人工智能课程期中考试的数据集,用于进行二元分类的探索性数据分析(EDA)实践。数据集旨在根据患者的性别、年龄、既往病史和吸烟状态等参数,预测患者是否可能患有卒中。每行数据都提供了关于患者的相关信息。
数据集包含以下字段:
id:唯一标识符
gender:性别,取值为"Male"、"Female"或"Other"
age:年龄
hypertension:高血压,0表示无,1表示有
heart_disease:心脏病,0表示无,1表示有
ever_married:是否已婚,取值为"No"或"Yes"
work_type:工作类型,取值为"children"、"Govt_jov"、"Never_worked"、"Private"或"Self-employed"
Residence_type:居住地类型,取值为"Rural"或"Urban"
avg_glucose_level:平均血糖水平
bmi:身体质量指数
smoking_status:吸烟状态,取值为"formerly smoked"、"never smoked"、"smokes"或"Unknown"(表示未知)
stroke:是否患有卒中,1表示有,0表示无
数据用途概述:
该数据集主要用于机器学习和数据分析教学,特别是二元分类模型的实践。学生可以使用此数据集进行数据预处理、特征工程、模型构建和评估等练习。此外,该数据集也可用于探索卒中相关的风险因素,加深对卒中发病机制的理解。