客户服务电子邮件情感分析与问题诊断数据集
数据来源:互联网公开数据
标签:客户服务,电子邮件,情感分析,自然语言处理,问题诊断,文本数据,合成数据
数据概述:
本数据集包含由Gemini Pro生成的模拟客户服务电子邮件,旨在用于客户服务邮件分析、情感分析模型训练等研究。数据集模拟了Aetheros公司(一家为Web应用程序提供中间件解决方案的公司)的客户服务邮件场景,该公司提供五项主要服务:API开发、API监控、IAM(身份和访问管理)、Mercury语言(一种API开发语言)和完全托管的云服务。电子邮件围绕这些服务的问题、咨询或建议展开,并被组织成邮件线程,每个线程通常包含4-5封邮件。
数据结构包含以下字段:
subject:邮件主题
sender:发件人邮箱
receiver:收件人邮箱(公司邮箱)
timestamp:邮件接收时间戳
message_body:邮件正文
thread_id:邮件线程的唯一标识符
email_types:邮件类型,包含“inquiry”(咨询)和“issue”(问题)
email_status:邮件状态,包括“ongoing”(进行中)和“completed”(已完成)
email_criticality:邮件紧急程度,包括“low”(低)、“medium”(中)和“high”(高)
product_types:邮件涉及的产品类型,包括“API开发”、“API监控”、“IAM”、“Mercury语言”和“云管理”
agent_effectivity:客服处理问题的有效性,包括“very low”(非常低)、“low”(低)、“medium”(中)、“high”(高)和“very high”(非常高)
agent_efficiency:客服处理问题的效率,包括“very low”(非常低)、“low”(低)、“medium”(中)、“high”(高)和“very high”(非常高)
customer_satisfaction:客户满意度,范围从-1到+1,负值表示不满,正值表示满意
数据用途概述:
该数据集主要用于情感分析、文本分类、自然语言处理模型的训练和评估,以及客户服务领域的应用研究。研究人员可以利用该数据集开发和测试情感分析模型,分析客户反馈,诊断客户服务中的问题,并优化客户服务流程。此外,该数据集也适用于教学和学术研究,例如,用于演示文本挖掘和情感分析技术。