数据集概述
本数据集是将传统事件日志转换为OCEL 1.0 JSONOCEL和OCEL 2.0 XML格式的公平性流程挖掘数据,涵盖招聘、医院、贷款、租赁四个场景,包含人员、事件层面属性及各场景的流程特征,可用于公平性评估与流程分析,共8个文件。
文件详解
- 招聘场景文件
- 文件名称:hiring_log_high.xml、hiring_log_high.jsonocel
- 文件格式:XML、JSONOCEL
- 字段映射介绍:包含Person类型对象属性(overallProtected、sumBoolDiscrFactors、reworkedActivities、throughputTime、numOcc_ACTIVITY、age、citizenship、German proficiency、gender、religion、years of education)及事件属性(resource),记录招聘流程从申请到结果的全链路数据。
- 医院场景文件
- 文件名称:hospital_log_high.xml、hospital_log_high.jsonocel
- 文件格式:XML、JSONOCEL
- 字段映射介绍:包含Person类型对象属性(overallProtected、sumBoolDiscrFactors、reworkedActivities、throughputTime、numOcc_ACTIVITY、age、underlying condition、citizenship、German language proficiency、gender、private insurance)及事件属性(resource),记录医院从挂号到治疗的流程数据。
- 贷款场景文件
- 文件名称:lending_log_high.xml、lending_log_high.jsonocel
- 文件格式:XML、JSONOCEL
- 字段映射介绍:包含Person类型对象属性(overallProtected、sumBoolDiscrFactors、reworkedActivities、throughputTime、numOcc_ACTIVITY、age、citizen、German speaking、gender、YearsOfEducation、CreditScore)及事件属性(resource),记录贷款从申请到审批的流程数据。
- 租赁场景文件
- 文件名称:renting_log_high.xml、renting_log_high.jsonocel
- 文件格式:XML、JSONOCEL
- 字段映射介绍:包含Person类型对象属性(overallProtected、sumBoolDiscrFactors、reworkedActivities、throughputTime、numOcc_ACTIVITY、age、citizen、German speaking、gender、religious affiliation、yearsOfEducation)及事件属性(resource),记录租赁从申请到结果的流程数据。
数据来源
Zenodo - Record 8059489
适用场景
- 流程公平性评估:分析招聘、医院、贷款、租赁场景中属性(如年龄、性别、国籍)对流程结果的影响,检测潜在歧视。
- 流程挖掘算法测试:验证流程挖掘算法在OCEL格式下对多场景流程的解析与分析能力。
- 公平性算法开发:为公平性评估算法提供标注属性(overallProtected)与测试数据,支持公平性算法研发。
- 行业流程特征分析:提取各场景流程的关键节点与变异路径,优化行业流程设计。