印尼劳工收入预测数据集IndonesiaLaborIncomePredictionDataset-safirakemaladewi
数据来源:互联网公开数据
标签:收入预测, 劳工, 人口统计, 机器学习, 分类模型, 职业, 教育, 统计分析
数据概述:
该数据集包含来自印尼劳工的数据,记录了个体人口统计特征与收入水平之间的关系,旨在用于收入预测模型的构建与分析。主要特征如下:
时间跨度:数据未标明具体时间,通常被视为静态数据集,反映了特定时期的劳工状况。
地理范围:数据主要覆盖印度尼西亚的劳工群体。
数据维度:数据集包含多个特征,包括年龄(Umur)、工作类别(Kelas Pekerja)、最终权重(Berat Akhir)、教育程度(Pendidikan)、受教育年限(Jmlh Tahun Pendidikan)、婚姻状况(Status Perkawinan)、职业(Pekerjaan)、性别(Jenis Kelamin)、资本收益(Keuntungan Kapital)、资本损失(Kerugian Capital)和每周工作小时数(Jam per Minggu),以及目标变量——收入(Gaji)。
数据格式:数据集以CSV格式提供,包含train.csv和test.csv两个文件,其中train.csv包含目标变量“Gaji”,test.csv用于模型测试。
数据来源:数据来源于公开数据集,已进行初步的结构化处理。
该数据集适合用于收入预测、劳工市场分析、以及人口统计学研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于劳工经济学、社会学和机器学习交叉领域的研究,如收入影响因素分析、收入不平等研究等。
行业应用:可以为人力资源行业、金融行业和政府部门提供数据支持,尤其是在人才招聘、薪酬管理、政策制定等方面。
决策支持:支持企业在招聘、薪酬方面的决策,以及政府部门在劳工政策制定方面的决策。
教育和培训:作为数据科学、机器学习和统计学课程的实训案例,帮助学生理解数据分析流程和模型构建。
此数据集特别适合用于构建预测模型,探索影响印尼劳工收入的关键因素,并为相关领域的决策提供数据支持。