提示重写三元组数据集

提示重写三元组数据集 数据来源:互联网公开数据
标签:提示重写, LLM训练, 自然语言处理, 数据清洗, 字段映射, 机器学习, 人工智能

数据概述:
本数据集为用于大型语言模型(LLM)提示恢复竞赛的三元组数据集。原始数据集包含四个字段:prompt、original_text、input 和 generated_text。为了确保数据集在训练过程中的兼容性和稳定性,删除了一个字段,并对剩余字段进行了重命名。最终字段包括:rewrite_prompt(重写提示)、original_text(原始文本)和 rewritten_text(重写文本)。数据集规模为70,000条记录,适用于自然语言处理任务中的提示工程和模型优化。

数据用途概述:
该数据集适用于以下场景:大型语言模型的训练与优化、提示工程研究、文本重写任务的模型评估、训练数据准备等。研究人员和开发者可以利用此数据集进行模型训练、性能评估以及提示策略优化。数据集的结构清晰,字段定义明确,适合用于学术研究、工业应用以及技术开发场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 61.78 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。