-
CodeGen_Based_构建系统代码生成实证研究数据集
2026年1月30日 30 169 22
数据集概述 本数据集为构建系统代码生成实证研究的复制包,包含用于训练和测试CodeGen大语言模型的构建文件数据。数据分为来自Apache软件基金会的专家数据集(9,426个构建文件)和来自GitHub的通用数据集(3,917个构建文件),总计13,343个Maven构建文件,用于研究大语言模型在构建系统代码预测中的应用效果。 文件详解 数据集压缩包...
2026年1月30日 30 169 22