基于Accenture评论的员工流失预测数据集

基于Accenture评论的员工流失预测数据集

数据来源:互联网公开数据

标签:员工流失, HR分析, NLP, 机器学习, 预测模型, 职场体验, 满意度分析

数据概述

本数据集来源于一次关于员工流失(Attrition)分析的AI黑客马拉松挑战,结合了统计分析和自然语言处理(NLP)两个维度的内容。数据集旨在通过分析员工的离职原因,预测哪些员工更可能离职,并探索减少员工流失的主动方法。

  1. 统计分析部分 该部分包含员工的详细属性数据,涵盖多个维度,如年龄、离职状态、出差频率、每日薪资、所属部门、教育背景、工作满意度等。具体字段包括:
  2. Age:员工年龄
  3. Attrition:离职状态(是否离职)
  4. BusinessTravel:出差频率
  5. DailyRate:每日薪资
  6. Department:所属部门
  7. DistanceFromHome:住家与工作地点距离
  8. Education:教育水平
  9. EducationField:教育领域
  10. EmployeeCount:员工人数
  11. EmployeeNumber:员工编号
  12. EnvironmentSatisfaction:工作环境满意度
  13. Gender:性别
  14. HourlyRate:时薪
  15. JobInvolvement:工作投入度
  16. JobLevel:职位级别
  17. JobRole:职位角色
  18. JobSatisfaction:工作满意度
  19. MaritalStatus:婚姻状态
  20. MonthlyIncome:月收入
  21. MonthlyRate:月薪资
  22. NumCompaniesWorked:曾工作过的公司数量
  23. Over18:是否年满18岁
  24. Overtime:加班情况
  25. PercentSalaryHike:薪资涨幅百分比
  26. PerformanceRating:绩效评级
  27. RelationshipSatisfaction:人际关系满意度
  28. StandardHours:标准工时
  29. StockOptionLevel:股票期权级别
  30. TotalWorkingYears:总工作年限
  31. TrainingTimesLastYear:去年的培训次数
  32. WorkLifeBalance:工作与生活平衡
  33. YearsAtCompany:在公司工作年限
  34. YearsInCurrentRole:在当前职位工作年限
  35. YearsSinceLastPromotion:上次晋升以来的年限
  36. YearsWithCurrManager:与当前经理共事年限

  37. NLP分析部分 该部分包含员工的反馈数据,如评论、满意度评分、绩效评估等。具体字段包括:

  38. review_title:评论标题
  39. overall_rating:总体评分
  40. review_text:评论内容
  41. recommends:是否推荐
  42. pros:优点
  43. cons:缺点
  44. experience:工作体验
  45. shift:工作转变

数据来源 数据集整合了多个公开数据源,包括但不限于: - IBM人力资源分析离职数据集 - 员工离职数据集 - 职场满意度分析数据集 - 员工调查数据集 - 员工评论数据集

数据规模 本数据集包含数千条记录,统计分析部分和NLP分析部分的数据量分别根据具体数据源决定,整体数据规模较大,适合用于复杂建模和分析。

数据用途概述

该数据集具有广泛的应用场景,适用于多个领域,包括但不限于:

  1. 员工流失预测模型
  2. 研究人员和数据科学家可以利用统计和NLP分析字段,构建预测模型,识别哪些员工更有可能离职。
  3. 通过分析关键字段(如工作满意度、薪资涨幅、绩效评级等),预测离职风险。

  4. HR策略优化

  5. HR部门可以基于数据集中的统计分析结果,制定针对性的员工保留策略,例如改善工作环境满意度、提升薪资待遇等。
  6. 利用NLP分析部分,深入理解员工的离职原因和工作体验,优化员工管理。

  7. 员工满意度分析

  8. 通过NLP分析员工的评论和反馈,识别影响员工满意度的关键因素,为改善员工体验提供依据。

  9. 绩效管理

  10. 结合员工绩效评级和离职倾向,优化绩效管理流程,提升员工留存率。

  11. 入职与离职趋势研究

  12. 分析员工在公司的工作年限、职位变动等数据,研究入职与离职的长期趋势,为战略决策提供支持。

  13. 跨领域研究

  14. 数据集中的多维度数据(统计与NLP结合)适合用于跨领域的研究,例如心理学、组织行为学、管理学等,探索员工行为与工作环境之间的复杂关系。

数据集特点 - 综合性:结合了统计分析和NLP分析两个方面,提供了全面的员工数据视角。 - 多样性:数据来源丰富,涵盖多个公开数据集,样本量大且具有代表性。 - 实用性:适用于解决实际的员工流失预测和管理问题。 - 可扩展性:数据集中的字段和结构设计合理,支持进一步的扩展和深度分析。

通过该数据集,用户能够深入探究员工流失的原因,构建预测模型,并为HR部门和企业管理提供有价值的决策支持。无论是学术研究还是实际应用,本数据集都具有重要的参考价值。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.58 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。