成人普查收入数据集

成人普查收入数据集 数据来源:互联网公开数据 标签:普查数据,收入预测,人工智能,数据预处理,分类分析,社会经济研究 数据概述: 本数据集源自1994年美国人口普查局数据库,由Ronny Kohavi和Barry Becker提取。数据集选取了满足特定条件(年龄大于16岁,年收入大于100美元,权重大于1,每周工作小时数大于0)的相对干净的记录。该数据集用于预测个人年收入是否超过50,000美元。为提高数据质量,使用人工智能技术对原始数据进行了自动修改,包括将连续变量离散化为相关区间,并将分类变量值分组以减少变量的模态性。 数据用途概述: 该数据集适用于收入预测、社会经济研究、分类分析等多种场景。研究人员可以通过分析数据了解不同特征对年收入的影响;数据科学家可以利用数据改进预测模型;政策制定者可以基于数据制定更加有效的社会经济政策。此外,数据集也适合用于教育培训,帮助学习者掌握数据预处理和分类分析的技巧。 举例: 数据集中包含个人的基本信息、职业、教育水平、婚姻状况、种族、性别、工作时间和年收入等字段。例如,数据集中的一条记录可能显示某个人的年龄为39岁,职业为技术销售,教育水平为高中学历,婚姻状况为已婚,种族为白人,性别为男性,每周工作时间为40小时,年收入为50,000美元以上。通过分析这样的记录,可以研究不同特征如何影响个人的收入水平。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.3 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。