员工离职预测数据集EmployeeAttritionPredictionDataset-tianlemeng1928745
数据来源:互联网公开数据
标签:员工流失, 人力资源, 机器学习, 预测模型, 员工属性, 组织行为学, 员工满意度, 离职分析
数据概述:
该数据集包含来自企业内部的员工信息,记录了影响员工离职的关键因素。主要特征如下:
时间跨度:数据未标明具体时间,可视为一段时间内的静态数据集合。
地理范围:数据未限定具体地理位置,通常代表企业内部的员工构成。
数据维度:数据集包含多个维度,涵盖员工的个人信息、工作相关因素、薪资福利、工作环境等。主要字段包括:EmployeeID(员工编号),Age(年龄),Attrition(离职与否),BusinessTravel(出差频率),DailyRate(日工资),Department(部门),DistanceFromHome(离家距离),Education(教育程度),EducationField(教育领域),EnvironmentSatisfaction(环境满意度),Gender(性别),HourlyRate(时薪),JobInvolvement(工作投入度),JobLevel(职位级别),JobRole(职位),JobSatisfaction(工作满意度),MaritalStatus(婚姻状况),MonthlyIncome(月收入),MonthlyRate(月费率),NumCompaniesWorked(工作过的公司数量),Over18(是否超过18岁),OverTime(是否加班),PercentSalaryHike(薪资涨幅),PerformanceRating(绩效评分),RelationshipSatisfaction(关系满意度),Shift(班次),TotalWorkingYears(总工作年限),TrainingTimesLastYear(去年培训次数),WorkLifeBalance(工作生活平衡),YearsAtCompany(在公司年限),YearsInCurrentRole(现岗位年限),YearsSinceLastPromotion(上次晋升年限),YearsWithCurrManager(与现任经理共事年限)。
数据格式:CSV格式,包含train.csv和test.csv两个文件,方便数据分析和建模。数据集已进行匿名化处理,保护员工隐私。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于人力资源管理、组织行为学等领域的学术研究,如员工离职原因分析、离职风险预测模型构建等。
行业应用:为企业人力资源部门提供数据支持,特别是在员工保留、人才管理、薪酬优化等方面提供决策依据。
决策支持:支持企业制定更有效的员工管理策略,例如识别高离职风险员工、优化员工福利、改善工作环境等。
教育和培训:作为数据科学、机器学习、人力资源管理等课程的实训材料,帮助学生和研究人员熟悉真实业务场景下的数据分析。
此数据集特别适合用于探索员工离职的影响因素,构建预测模型,从而帮助企业降低员工流失率,提升组织绩效。