LLM_Based_大语言模型数学应用题求解挑战分析结果数据

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

LLM_Based_大语言模型数学应用题求解挑战分析结果数据

数据集概述

本数据集包含不同大语言模型（LLMs）对SVAMP数据集数学应用题的求解输出，以及CodeLlama模型未能正确解决的问题标记语句。数据集共包含两个文件，可用于分析大语言模型在数学应用题求解中的挑战与不足。

文件详解

all_data.json
文件格式：JSON
字段映射介绍：包含大语言模型针对SVAMP数据集生成的数学应用题求解样本数据
df_combined.pkl
文件格式：PKL
字段映射介绍：包含CodeLlama模型未能正确解决的SVAMP数据集数学应用题标记语句数据

数据来源

论文“Beyond the Hype: Identifying and Analyzing Math Word Problem-Solving Challenges for Large Language Models”

适用场景

大语言模型能力评估: 分析不同LLM在数学应用题求解任务中的性能表现与差异
模型错误模式研究: 探究CodeLlama等模型在数学应用题求解中的常见错误类型与原因
数学推理任务优化: 基于模型错误数据改进LLM的数学推理能力与问题理解能力
教育AI应用开发: 为智能教育系统中数学问题自动求解功能的设计提供参考依据

数据与资源

12771266.zipZIP
237.62 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	237.62 MiB
最后更新	2026年1月29日
创建于	2026年1月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？