基于T5数据增强的人机交互聊天消息数据集-birdy654

基于T5数据增强的人机交互聊天消息数据集-birdy654 数据来源:互联网公开数据 标签:人机交互,聊天消息,T5,数据增强,文本分类,人工智能,研究数据

数据概述: 本数据集包含通过T5模型进行同义改写后的聊天消息。这些改写后的消息用于增强原始聊天数据集,从而在不增加数据收集成本的情况下提高人类聊天消息的分类准确性。数据集中的每条记录都包括原始消息及其通过T5生成的同义版本。

数据用途概述: 该数据集适用于自然语言处理研究中的文本分类任务,特别是在人机交互(如聊天机器人)领域。研究者和开发者可以使用此数据集来训练和评估文本分类模型,以提高其对人类聊天消息的识别和分类能力。此外,该数据集也可用于教育和培训目的,帮助学生理解数据增强技术在自然语言处理中的应用。原始研究《Chatbot Interaction with Artificial Intelligence: Human Data Augmentation with T5 and Language Transformer Ensemble for Text Classification》进一步介绍了此数据集的收集和使用细节。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 23, 2025, 07:19 (UTC)
创建于 四月 23, 2025, 07:19 (UTC)