AraSTEM_阿拉伯语STEM学科大语言模型能力评估完整数据

数据集概述

AraSTEM数据集专为评估大语言模型在阿拉伯语STEM(科学、技术、工程和数学)学科领域的知识水平而设计。该数据集包含涵盖多个主题和难度级别的选择题,要求模型展示对阿拉伯语科学内容的深度理解能力。数据集包含问题、选项、正确答案、学科分类、难度级别以及资源链接等信息,总计包含一个数据文件。

文件详解

  • AraSTEM.json
  • 文件格式:JSON
  • 字段映射介绍:包含以下关键字段:
  • 问题:阿拉伯语STEM学科的选择题内容
  • 选项:对应的选择题选项
  • 正确答案:问题的标准答案
  • 学科:题目所属的STEM学科分类
  • 难度级别:题目的难度等级
  • 资源链接:相关参考资源的链接信息

适用场景

  • 大语言模型能力评估:用于测试和评估大语言模型在阿拉伯语STEM学科领域的知识掌握程度和推理能力
  • 阿拉伯语自然语言处理研究:支持阿拉伯语科学文本理解和问答系统的开发与优化
  • 教育技术应用:为阿拉伯语STEM教育领域的自适应学习系统和智能辅导工具提供评估基准
  • 跨语言模型比较:比较不同语言模型在阿拉伯语科学内容理解方面的性能差异
  • 多模态学习研究:结合文本和科学概念的多模态学习模型训练与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.65 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。