多语言大规模多任务语言理解数据集

多语言大规模多任务语言理解数据集 数据来源:互联网公开数据 标签:多语言,任务理解,人工智能,评测,翻译,低资源语言 数据概述: 本数据集包含了广泛认可的多语言大规模多任务语言理解(MMMLU)基准测试集,涵盖57个不同类别的广泛主题,从基础知识到高级专业科目(如法律、物理、历史和计算机科学)。测试集被翻译成14种语言,包括阿拉伯语、孟加拉语、德语、西班牙语、法语、印地语、印尼语、意大利语、日语、韩语、巴西葡萄牙语、斯瓦希里语、约鲁巴语和简体中文。使用专业的人类翻译确保了翻译的准确性,尤其对于资源较少的语言(如约鲁巴语),从而增强了数据集的可靠性。 数据用途概述: 该数据集适用于评估和改进人工智能模型在多种语言上的广泛知识理解能力。研究人员可以利用此数据集来衡量AI模型在不同语言和主题上的性能,确保其能够准确地服务于不同语言社区,特别是那些代表性不足的群体。此外,数据集对于促进AI技术的全球包容性和有效性具有重要意义。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 31.04 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。