印尼收入预测数据集IndonesiaIncomePredictionDataset-ghalih26
数据来源:互联网公开数据
标签:收入预测, 人口统计, 机器学习, 经济分析, 职业分类, 数据挖掘, 决策树, 梯度提升
数据概述:
该数据集包含来自印尼地区的人口收入相关数据,记录了个人的人口统计特征及其对应的收入水平。主要特征如下:
时间跨度:数据未明确标注具体时间,可视为一个静态的收入快照数据集。
地理范围:数据主要针对印度尼西亚地区的人口收入情况。
数据维度:数据集包括多个维度,如:id(个体唯一标识)、Umur(年龄)、Kelas Pekerja(工作类型)、Berat Akhir(最终权重)、Pendidikan(教育程度)、Jmlh Tahun Pendidikan(受教育年限)、Status Perkawinan(婚姻状况)、Pekerjaan(职业)、Jenis Kelamin(性别)、Keuntungan Kapital(资本收益)、Kerugian Capital(资本损失)、Jam per Minggu(每周工作时长)和Gaji(收入)。
数据格式:CSV格式,文件名为Pendapatancsv,便于数据分析和处理。
来源信息:数据来源于公开数据集,已进行初步的结构化处理,方便直接用于分析。
该数据集适合用于收入预测、人口统计分析和机器学习模型的训练与评估。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于经济学、社会学等领域的研究,例如收入影响因素分析、不同人群收入差异研究等。
行业应用:可以为人力资源管理、市场调研等行业提供数据支持,例如人员薪资预测、目标客户群体分析等。
决策支持:支持政府部门制定相关政策,例如精准扶贫、就业促进等。
教育和培训:作为数据分析、机器学习等课程的实训材料,帮助学生理解和应用相关技术。
此数据集特别适合用于探索影响个人收入的关键因素,以及构建预测模型,帮助用户更好地理解和预测印尼地区的收入分布情况。