数据集概述
本数据集来源于一项针对国际软件公司帮助台团队的实验研究,旨在构建基于工单报告和对话行为分类特征的自动化绩效评估模型。数据提取自PostgreSQL数据库,涵盖2016年1月至2023年3月期间的帮助台工单汇总信息,部分字段已匿名化处理以保护隐私。数据集包含工单基本信息、变更历史、处理快照、绩效评分样本及对话内容等九个文件。
文件详解
- issues.csv(工单主表)
- 文件格式:CSV
- 字段映射介绍:包含所有上报工单的核心信息,如分类、优先级、上报人、关联项目、分配处理人、开始时间、解决时间及各处理步骤耗时(秒)。
- issues_change_history.csv(工单变更历史)
- 文件格式:CSV
- 字段映射介绍:记录工单处理人和状态变更的时间点,用于计算各步骤处理时长。
- issues_snapshots.csv(工单处理快照)
- 文件格式:CSV
- 字段映射介绍:与issues.csv记录相同,但对由多人处理的工单进行重复记录,每条记录代表单个处理人的处理周期。
- scored_issues_snapshot_sample.xlsx(绩效评分样本)
- 文件格式:XLSX
- 字段映射介绍:从工单中提取的分层代表性样本,由帮助台经理根据三个目标对解决绩效进行评分(5分最高,1分最低)。
- sample_utterances.csv(对话样本)
- 文件格式:CSV
- 字段映射介绍:仅包含绩效评分样本工单对应的客户与帮助台团队之间的交流消息(评论)。
- FEATURES.md(字段说明文档)
- 文件格式:MD
- 字段映射介绍:详细描述各数据集的字段定义和含义。
- EXAMPLE.md(示例说明文档)
- 文件格式:MD
- 字段映射介绍:展示典型工单在所有数据集中的关联示例,帮助理解数据关系。
- process-flow.png(处理流程图)
- 文件格式:PNG
- 字段映射介绍:演示帮助台团队解决工单的标准流程步骤。
- db.png(数据库示意图)
- 文件格式:PNG
- 字段映射介绍:展示数据来源的数据库结构示意图。
数据来源
国际软件公司帮助台团队实验研究
适用场景
- 工单数量预测:基于历史数据预测未来工单量变化趋势。
- 回归分析:研究工单处理时间与各种因素之间的关联关系。
- 关联规则挖掘:发现工单处理过程中的频繁模式和规则。
- 自然语言处理:分析客户与帮助台之间的对话内容和语义特征。
- 分类任务:对工单类型、优先级或处理结果进行分类预测。
- 聚类分析:识别工单处理模式和团队绩效特征群组。