CoderEval_Based_代码生成基准评估数据集

数据集概述

本数据集为CoderEval代码生成基准数据集,包含四十二个文件,无目录结构。核心内容为用于评估生成式预训练模型代码生成性能的基准数据,涵盖JSON格式结果文件、JSONL格式原始/处理数据、Python脚本、说明文档及压缩包,支持超越独立函数的实用代码生成能力评估。

文件详解

  • 数据文件(.json)
  • 文件名称:CoderEval4Python.json、results-0-10.json等(共25个)
  • 文件格式:JSON
  • 字段映射介绍:包含代码生成任务的输入数据、模型生成结果及评估结果等结构化信息
  • 数据文件(.jsonl)
  • 文件名称:generated_results.jsonl、Raw_Input.jsonl_out.jsonl等(共13个)
  • 文件格式:JSONL
  • 字段映射介绍:包含原始输入数据、人工标注数据、模型生成结果等按行存储的半结构化数据
  • 代码文件(.py)
  • 文件名称:convertdata.py、run_gpt_generation.py
  • 文件格式:Python脚本
  • 字段映射介绍:数据转换脚本与模型生成运行脚本,用于数据集处理与模型评估流程
  • 文档文件(.md)
  • 文件名称:README.md
  • 文件格式:Markdown
  • 字段映射介绍:CoderEval基准的说明文档,包含数据集背景、使用方法等信息
  • 压缩包文件(.zip)
  • 文件名称:CoderEval-Input4Models.zip
  • 文件格式:ZIP
  • 字段映射介绍:模型输入数据的压缩包,包含用于模型评估的输入文件

适用场景

  • 代码生成模型性能评估: 用于评估生成式预训练模型在实用代码生成任务中的表现
  • 自然语言处理技术研究: 支持代码生成领域的技术研究与模型优化
  • 基准数据集对比分析: 与HumanEval等基准数据集对比,分析模型在不同代码生成场景下的能力差异
  • 代码生成任务流程优化: 基于Python脚本与数据文件,优化代码生成任务的数据处理与评估流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 32.0 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。