杜德米夫林纸业公司员工流失预测数据集-cocolicoq4
数据来源:互联网公开数据
标签:员工流失,人力资源分析,预测模型,机器学习,杜德米夫林,办公场景,工作满意度,数据分析
数据概述:
本数据集模拟了美国杜德米夫林纸业公司斯克兰顿分公司员工的流失情况,旨在用于员工流失预测研究。数据集包含了公司员工的个人信息、工作表现、工作环境等多个维度的数据,共包含15个特征字段,旨在反映影响员工离职的关键因素。数据模拟了“办公室”情景,以增加数据集的趣味性和可读性。
数据集包含以下字段:
EmployeeID:员工唯一标识符。
Tenure:员工在公司的服务年限。
Salary:员工的年薪。
Department:员工所在部门(例如:销售、会计、客户服务)。
JobSatisfaction:员工的自评工作满意度(1-5分,5分最高)。
WorkLifeBalance:员工的自评工作与生活平衡程度(1-5分,5分最佳)。
CommuteDistance:员工通勤距离(例如:短、中、长)。
MaritalStatus:员工的婚姻状况(例如:单身、已婚、离异)。
Education:员工的最高学历(例如:高中、本科、硕士)。
PerformanceRating:员工的绩效评分(1-5分,5分最佳)。
TrainingHours:员工接受的培训时长。
OverTime:员工是否加班。
NumProjects:员工当前参与的项目数量。
YearsSincePromotion:距离员工上次晋升的年数。
EnvironmentSatisfaction:员工的自评环境满意度(1-5分,5分最高)。
Branch: 员工所在分支机构
目标变量(分类):
员工根据其离职可能性被分为四类:
Class A:极有可能离职。
Class B:较有可能离职。
Class C:略有可能离职。
数据用途概述:
该数据集主要用于员工流失预测模型的构建与分析。研究人员可以使用该数据进行以下工作:
1. 探索性数据分析(EDA):分析不同因素与员工流失之间的关系,例如,薪资、工作满意度、工作时长等。
2. 构建预测模型:利用机器学习算法,如逻辑回归、决策树、随机森林等,构建预测模型,预测员工流失的可能性。
3. 特征重要性分析:识别影响员工流失的关键因素,为公司提供改进建议。
4. 可视化分析:利用图表展示数据,更直观地理解员工流失的影响因素。
该数据集适用于人力资源管理、数据科学、机器学习等领域的学习和实践,也可用于模拟“办公室”场景下的数据分析。
使用说明:
本数据集为虚构数据,仅用于教育和演示目的。不应用于实际的业务决策或对真实员工或组织的任何推断。