数据集

成人收入预测数据集AdultIncomePredictionDataset-aledenigres

数据来源：互联网公开数据

标签：人口统计, 收入预测, 机器学习, 统计分析, 分类任务, 数据挖掘, 劳动力市场, 社会经济

数据概述：该数据集包含来自公开人口普查的数据，记录了关于个人的社会经济特征，并标注了其收入水平。主要特征如下：时间跨度：数据未标明具体时间，可视为某一时间点的横截面数据。地理范围：数据可能来源于美国或其他国家的人口普查，未明确标注具体地域。数据维度：包括“Id”（唯一标识符）、“age”（年龄）、“workclass”（工作类别）、“fnlwgt”（人口普查权重）、“education”（教育程度）、“educationnum”（受教育年限）、“maritalstatus”（婚姻状况）、“occupation”（职业）、“relationship”（家庭关系）、“race”（种族）、“sex”（性别）、“capitalgain”（资本收益）、“capitalloss”（资本损失）、“hoursperweek”（每周工作小时数）、“nativecountry”（原籍国）、“income”（收入水平，50K）等多个字段。数据格式：CSV格式，包含 train_data.csv 和 test_data.csv 两个文件，便于数据分析和模型训练。数据来源：数据可能来源于公开的人口普查数据，已进行匿名化处理，并提供了用于训练和测试的数据集。该数据集适合用于人口统计分析、收入预测建模等。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于社会经济学、统计学和机器学习领域的学术研究，如收入影响因素分析、人口结构与收入关系研究。行业应用：可以为人力资源管理、市场调研等行业提供数据支持，尤其在劳动力市场分析、客户画像构建等方面。决策支持：支持政府部门和企业在制定相关政策和策略时参考，如社会保障、人才招聘等。教育和培训：作为统计学、机器学习课程的实训数据，帮助学生和研究人员掌握数据分析和建模技能。此数据集特别适合用于探索影响个人收入的因素，构建收入预测模型，并进行不同人群的收入差异分析。

数据与资源

versions_20250404094150.zipZIP
0.71 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.71 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。