美国成人收入普查数据集-1994年-srivasthavavasthava
数据来源:互联网公开数据
标签:成人收入,普查数据,预测,机器学习,推荐系统,人口统计,美国,收入预测
数据概述:
本数据集来源于1994年美国人口普查数据库,由Barry Becker提取。数据集包含了一组相对干净的记录,提取条件为:年龄大于16岁(AAGE > 16)、年收入大于100美元(AGI > 100)、年度家庭净重量大于1(AFNLWGT > 1)、每周工作小时数大于0(HRSWK > 0)。该数据集主要用于预测个人年收入是否超过50,000美元的任务。
数据集包含以下关键字段:
- AAGE:年龄
- WORKCLASS:工作类别
- FNLWGT:最终加权
- EDUCATION:教育程度
- EDUCATION_NUM:教育程度编号
- MARITAL_STATUS:婚姻状况
- OCCUPATION:职业
- RELATIONSHIP:关系
- RACE:种族
- SEX:性别
- CAPITAL_GAIN:资本收益
- CAPITAL_LOSS:资本损失
- HOURS_PER_WEEK:每周工作小时数
- NATIVE_COUNTRY:出生国家
- INCOME:年收入是否超过50,000美元
数据集可以从提供的CSV文件路径获取:“C:\Users\Shashikanth\Downloads\PPPPPPPPP (1) (5).csv”。同时,相关的图像数据可以通过提供的Python代码下载。
数据用途概述:
该数据集适用于多种应用场景,包括但不限于:
1. 收入预测建模:利用机器学习算法预测个人年收入是否超过50,000美元。
2. 人口统计学研究:分析不同人口特征(如年龄、性别、教育程度等)与收入之间的关系。
3. 数据可视化:通过图表展示数据集中的关键信息和趋势。
4. 智能推荐系统:基于人口统计信息提供个性化建议或推荐服务。
数据集为研究人员、数据科学家和政策制定者提供了宝贵的数据资源,有助于深入理解美国成年人的收入状况和经济特征。