开放数学指令调优数据集-2023

开放数学指令调优数据集-2023 数据来源:互联网公开数据 标签:数学,指令调优,教育,数据集,问题解答,代码解析,机器学习,模型训练

数据概述: 开放数学指令调优数据集(OpenMathInstruct-1)包含180万个问题-解答对,这些数据是通过使用Mixtral-8x7B模型生成的。问题来源于GSM8K和MATH训练子集,解答则是通过允许Mixtral模型结合文本推理和Python解释器执行的代码块合成生成的。数据集分为训练和验证两个子集,用于消融实验。这两个子集结合覆盖了GSM8K和MATH的完整训练集。

数据集包含以下字段: question:原始问题,来自GSM8K或MATH训练集。 generated_solution:合成生成的解答,包含文本推理和代码块。 expected_answer:原始数据集中提供的真实答案。 predicted_answer:Mixtral模型在相应解答中预测的答案(从\boxed{}中提取)。 error_message:生成过程中可能出现的错误信息。

数据用途概述: 该数据集适用于数学教育、指令调优、模型训练和验证等多种场景。教育者可以利用此数据集进行数学问题解答的教学;研究人员可以使用此数据集进行模型性能评估和优化;开发人员可以利用此数据集进行机器学习模型的训练和测试。此外,该数据集还适合用于数据科学和编程技能的培训,帮助学习者理解和应用数学问题的解决方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 472.5 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。