Strategeion公司招聘系统简历技能数据集

Strategeion公司招聘系统简历技能数据集 数据来源:互联网公开数据 标签:招聘,机器学习,简历,技能,公平性,偏见,人口统计,职业,PARiS,Strategeion

数据概述: 本数据集模拟了Strategeion公司在“机器招聘”案例研究中使用的简历数据,旨在用于探讨机器学习中的公平性问题。数据集包含两部分,分别为用于训练和验证的resumes_development.csv(619条记录)和用于试点阶段的resumes_pilot.csv(1986条记录)。每个记录包含222个二元特征:218个技能特征,标识了申请人简历中是否包含对应的技能;4个受保护特征,包含了申请人的社会人口统计学信息。技能列表可在skills.txt文件中找到。

受保护特征包括: * Veteran:1代表申请人是退伍军人,0代表不是。 * Female:1代表申请人是女性,0代表不是。 * URM:1代表申请人是少数族裔,0代表不是。 * Disability:1代表申请人有残疾,0代表不是。

数据用途概述: 该数据集适用于机器学习公平性研究、偏见检测、简历分析、以及与“机器招聘”案例相关的教育和研究。研究人员可利用此数据评估机器学习模型在招聘过程中的潜在偏见,分析不同群体在技能方面的差异;教育工作者可以使用此数据进行案例分析,帮助学生理解公平性在人工智能中的重要性;开发者可以将其作为测试数据集,开发和评估更公平的招聘算法。此外,该数据集也适用于探索不同技能组合对招聘结果的影响。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。