客户服务中心关系策略数据集-旅行与电信领域-2016-veeralakrishna

客户服务中心关系策略数据集-旅行与电信领域-2016-veeralakrishna 数据来源:互联网公开数据 标签:客户服务中心,关系策略,IVAs,智能虚拟助手,旅行,电信,对话数据,注释,用户意图,语言类型

数据概述: 本数据集包含了从2016年8月在TripAdvisor.com航空论坛及三个商业客户服务中心智能虚拟助手(IVAs)收集的对话记录,涵盖旅行和电信两个领域。数据集记录了注释者标记的对确定用户意图不必要的文本,并通过第二轮注释确定了标记文本中的语言类型,如问候、背景信息、理由、感激、抱怨或情感表达。该数据集为提高IVAs的质量和关系能力提供了宝贵资源。

数据用途概述: 该数据集适用于客户服务中心研究、IVAs开发、对话系统优化、自然语言处理训练等场景。研究人员可以利用此数据集了解用户在对话中的关系策略;开发者可以改善IVAs的交互能力;教育和培训者可以将其用于教学演示和案例分析。此数据集为提升IVAs的用户满意度和对话质量提供了重要参考。

数据文件内容及格式:

x_y_align.csv 记录注释者x与其他注释者在组y中的对齐情况。

字段: Annotator A ID:注释者x的ID Annotator B ID:与注释者x计算对齐得分的注释者ID Group ID:包含比较用户所在的4人注释组ID Dataset ID:请求数据集y的ID Request ID:请求的唯一ID,用于文件间连接 Text:原始请求文本 Annotator A Text:注释者A标记的文本,标记部分用[ 和 ]括起 Annotator B Text:注释者B标记的文本,标记部分用[ 和 ]括起 Length:原始请求文本的字符长度 Error:注释者A和B二元判断不一致的字符位置数 Alignment Score:按公式align = (n - e) / n计算的对齐得分 Agreement:注释者A和B是否认为任何标记部分必要

all_data_by_threshold.csv 记录所有请求的合并标记,每个请求按4个不同的阈值重复。

字段: Dataset ID:请求数据集的ID Group ID:标记的4人注释组ID Request ID:请求的唯一ID,用于文件间连接 MultiIntent:1表示至少一个注释者标记文本包含多个用户意图,否则为0 Threshold:合并标记的阈值 MergedSelections:如果至少i个注释者标记为不必要的字符,则包含在标记部分用[ 和 ]括起 Unselected:MergedSelections中不在[ 和 ]括起的文本 Selected:MergedSelections中在[ 和 ]括起的文本 Removed:原始请求文本中被合并标记移除的文本比例

tagged_selections_by_sentence.csv 记录第二轮注释标记的第一轮注释中选择部分的关系语言,仅包含在all_data_by_threshold.csv中标记为非MultiIntent的请求。

字段: Dataset ID:请求数据集的ID Group ID:标记的4人注释组ID Request ID:请求的唯一ID,用于文件间连接 Threshold:合并标记的阈值 MergedSelections:如果至少i个注释者标记为不必要的字符,则包含在标记部分用[ 和 ]括起 Unselected:MergedSelections中不在[ 和 ]括起的文本 Selected:MergedSelections中在[ 和 ]括起的文本 Greeting:Selected中是否存在某种形式的问候语 Backstory:Selected中是否存在自我揭露语言 Justification:Selected中是否存在理由语言 Rant:Selected中是否存在抱怨 Gratitude:Selected中是否存在感激语 Other:Selected中是否包含任何关系语言 Express Emotion:Selected中是否包含非抱怨的情感语言

all_multi_intent.csv 记录至少一个注释者标记包含多个用户意图的请求,适用于开发多意图检测策略。

字段: Dataset ID:请求数据集的ID Group ID:标记的4人注释组ID Request ID:请求的唯一ID,用于文件间连接 Text:原始请求文本 Annotator x:如果注释者x认为文本包含多个意图则为1,否则为0

使用条款: 本RSiCS数据集在开放数据库许可证下免费公开,附加条件: 数据经过处理以移除个人身份信息(PII)和IVAs的来源。任何试图重新识别个人或商业IVAs数据源的行为都是禁止的。下载或使用该数据集将被视为同意不尝试任何形式的重新识别。 任何使用本数据集创建的出版物必须引用论文“Towards Awareness of Human Relational Strategies in Virtual Agents”。请参考bibTex。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 11.17 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。