大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001

大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001 数据来源:互联网公开数据 标签:MMLU,多学科,选择题,语言模型,评估,LLM_Science,竞赛,人工智能,NLP

数据概述: 本数据集源自MMLU(Massive Multitask Language Understanding)多学科多项选择题数据集,经过调整,使其与LLM_Science竞赛的格式保持一致。MMLU数据集涵盖了多个学科领域,旨在全面评估语言模型在不同任务上的理解和推理能力。

数据用途概述: 该数据集主要用于评估和比较大型语言模型(LLM)在各种学科领域的表现。研究人员可以利用此数据测试LLM的知识水平、推理能力和解决问题的能力,从而推动人工智能技术的进步。此外,该数据集也适用于教育和培训,帮助学习者理解语言模型的运作机制和局限性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 25.81 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。