CoderEval_Based_代码生成基准评估数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

CoderEval_Based_代码生成基准评估数据集

数据集概述

本数据集为CoderEval代码生成基准数据集，包含四十二个文件，无目录结构。核心内容为用于评估生成式预训练模型代码生成性能的基准数据，涵盖JSON格式结果文件、JSONL格式原始/处理数据、Python脚本、说明文档及压缩包，支持超越独立函数的实用代码生成能力评估。

文件详解

数据文件（.json）
文件名称：CoderEval4Python.json、results-0-10.json等（共25个）
文件格式：JSON
字段映射介绍：包含代码生成任务的输入数据、模型生成结果及评估结果等结构化信息
数据文件（.jsonl）
文件名称：generated_results.jsonl、Raw_Input.jsonl_out.jsonl等（共13个）
文件格式：JSONL
字段映射介绍：包含原始输入数据、人工标注数据、模型生成结果等按行存储的半结构化数据
代码文件（.py）
文件名称：convertdata.py、run_gpt_generation.py
文件格式：Python脚本
字段映射介绍：数据转换脚本与模型生成运行脚本，用于数据集处理与模型评估流程
文档文件（.md）
文件名称：README.md
文件格式：Markdown
字段映射介绍：CoderEval基准的说明文档，包含数据集背景、使用方法等信息
压缩包文件（.zip）
文件名称：CoderEval-Input4Models.zip
文件格式：ZIP
字段映射介绍：模型输入数据的压缩包，包含用于模型评估的输入文件

适用场景

代码生成模型性能评估: 用于评估生成式预训练模型在实用代码生成任务中的表现
自然语言处理技术研究: 支持代码生成领域的技术研究与模型优化
基准数据集对比分析: 与HumanEval等基准数据集对比，分析模型在不同代码生成场景下的能力差异
代码生成任务流程优化: 基于Python脚本与数据文件，优化代码生成任务的数据处理与评估流程

数据与资源

10515890.zipZIP
32.00 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	32.0 MiB
最后更新	2026年1月31日
创建于	2026年1月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？