沙特阿拉伯就业市场清理数据集
数据来源:互联网公开数据
标签:沙特阿拉伯,就业市场,数据清理,机器学习,劳动市场研究,职业分析,行业分布
数据概述:
本数据集是沙特阿拉伯原始职位发布数据的清理和增强版本,旨在支持数据分析、机器学习和劳动力市场研究。数据集简化了关键特征,将文本字段翻译为英文,并对分类变量进行了编码,便于使用。主要的转换包括:阿拉伯文文本(如城市名称、地区)翻译为英文;工作标题、公司规模和行业部门的简化和标准化;对公司类型、福利和性别的分类字段应用了二进制和数值编码;工作发布日期从伊斯兰历转换为公历。
数据用途概述:
该数据集适用于分析沙特阿拉伯的劳动力市场趋势,使用机器学习模型预测薪资或推荐职位角色,研究工作在各地区、城市和行业中的分布情况。该数据集为探索沙特阿拉伯就业市场、构建分析模型或进行统计分析提供了有价值的起点。
字段定义:
job_title:简化角色 - 核心职位角色映射到预定义类别(例如:会计、技术员)
job_date:日期(公历) - 职位发布日期
comp_name:AS-IS - 公司名称保持原始数据中的形式
comp_type:1, 0 - 1 表示私营公司,0 表示半政府部门
comp_size:MA, MB, MC 等 - 表示公司规模:MA - 中型A, SB - 小型B 等
eco_activity:各种部门 - 通用行业部门,如贸易和零售、医疗保健
region:名称(例如:东部) - 翻译和标准化的沙特阿拉伯地区(例如:东部省)
city:翻译名称 - 翻译和标准化的城市名称(例如:达曼,利雅得)
contract:1, 0 - 1 表示全职,0 表示远程
benefits:1, 0 - 1 表示提供福利,0 表示不提供福利
positions:数字(例如:10) - 职位提供的可用职位数量
exper:数值 - 所需的工作经验年数,转换为整数(例如:0, 2)
gender:0, 1, 2 - 0 表示男性,1 表示女性,2 表示两者
Salary:数值 - 以沙特阿拉伯里亚尔表示的薪资