人工智能知识测试性能分析参数与表现的关系

标题:人工智能知识测试性能分析参数与表现的关系

数据内容:该数据集包含了人工智能系统在知识测试中的表现数据,具体包括以下几个数据元素: - 实体(Entity):25种不同的AI系统或模型 - 编码(Code):统一的编码标识 - 年份(Year):5个不同的年份 - MMLU平均值(MMLU avg):25种不同的平均测试成绩 - 参数数量(Number of parameters):21种不同的参数规模 - 组织机构(Organization):8家不同的研发机构

数据来源:互联网公开数据

数据用途:该数据集可用于以下几个行业的研究和分析: - 人工智能行业:评估不同规模AI模型的性能表现 - 教育技术行业:分析知识测试系统的效果 - 科技研究:研究模型参数规模与性能之间的关系 - 数据科学:探索模型训练参数对系统表现的影响

标签:人工智能, 知识测试, 参数数量, 模型性能, MMLU基准, 人工智能研究, AI系统评估, 机器学习模型

行业分类:人工智能, 教育技术, 科技研究, 数据科学

packageimg

数据与资源

附加信息

字段
版本 1
最后更新 二月 24, 2025, 06:54 (UTC)
创建于 二月 24, 2025, 04:47 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。