航天工程与空间任务对话数据集AstroChat

航天工程与空间任务对话数据集AstroChat 数据来源:互联网公开数据 标签:航天工程,空间任务,对话,LLM,自然语言处理,人工智能,数据集,监督学习,GPT-4,对话生成

数据概述: AstroChat 是一个合成生成的数据集,包含 901 个对话,专门为航天工程和空间任务工程领域设计。该数据集旨在用于监督微调聊天大型语言模型 (LLM)。数据集由模拟用户和 AI 助手之间的对话组成,每个对话实例包含多个字段,如唯一标识符 (id)、主题 (topic)、子主题 (subtopic)、用户角色 (persona)、起始问题 (opening_question) 以及用户和 AI 助手之间的完整消息 (messages)。

数据用途概述: 该数据集主要用于对聊天 LLM 进行监督微调。由于数据集规模相对较小,建议结合预训练指令模型使用,并考虑结合其他 STEM(科学、技术、工程和数学)领域的数据集进行增强。具体应用场景包括但不限于:开发用于航天工程领域的智能对话系统、改进 LLM 在专业领域的知识表达能力、构建特定领域的问答系统等。数据集也适用于研究人员进行自然语言处理相关研究,以及教育培训,帮助学习者理解航天工程领域的专业知识。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 01:34 (UTC)
创建于 四月 15, 2025, 01:34 (UTC)