混合技能对话一个人对一个人对话数据集-2023-thedevastator
数据来源:互联网公开数据
标签:对话,混合技能,个性,同理心,知识,教育,机器学习,聊天机器人,研究
数据概述:
本数据集包含7000次对话记录,旨在探索各种对话模式,包括展现个性、表达同理心和展示知识。每个记录都根据角色、附加背景、前一句对话、自由消息、引导消息和建议字段进行了结构化,为激发创意对话提供了丰富的素材。该数据集适用于训练和验证对话模型,探索动态对话的潜力。
数据用途概述:
该数据集适用于训练和验证对话模型,研究对话中的个性和知识表现,开发知识型对话系统和聊天机器人。研究者可以利用此数据集生成创意响应,开发基于知识的对话,构建提供个性化和同理心支持的聊天机器人。此外,教育工作者可以使用该数据集进行对话技术的教学和演示。
数据集包含以下字段:
- 角色:对话中涉及的角色信息(文本)
- 附加背景:对话的附加背景信息(文本)
文件说明:
- validation.csv:验证集数据
- train.csv:训练集数据
- test.csv:测试集数据
每个文件中的字段相同,包括角色和附加背景信息。
使用说明:
1. 将数据集(验证集、训练集、测试集)加载到您选择的机器学习框架或编程语言中(如Python、R)。
2. 探索每个对话的字段信息,包括角色和附加背景等。
3. 利用这些信息创建模型,使其能够通过识别过去的对话来强调角色特征或知识话题。
4. 使用验证集和测试集数据测试和评估模型的性能,包括其在新对话中的表现能力和学习新概念的能力,同时保持其在不同情境下的特征一致性。
研究想法:
1. 使用创意角色和附加背景生成创意响应。
2. 根据建议字段中的推荐消息创建基于知识的对话。
3. 开发聊天机器人,利用角色和自由消息字段为用户提供个性化和同理心支持。
致谢:
如在研究中使用本数据集,请引用原作者和Huggingface Hub。
许可:
许可:CC0 1.0 Universal (CC0 1.0) - 公共领域奉献
无版权 - 您可以自由复制、修改、分发和表演该作品,即使用于商业目的,无需获得许可。参见其他信息。