找到33个数据集

标签: 代码片段

过滤结果
  • 复制包代码解析_混杂因素_智力_人格_研究

    2026年2月1日 30 16 9

    数据集概述 本数据集是论文《Code Comprehension Confounders: A Study of Intelligence and Personality》的复制包,包含支持研究的实验数据、分析脚本及实验材料。数据覆盖一百三十名参与者的公开数据,可用于复现代码理解与智力、人格因素关系的研究结论。 文件详解 压缩包文件...
    packageimg
  • SnipGen_Based_LLM代码生成能力评估数据集

    2026年1月30日 30 142 15

    数据集概述 本数据集是SnipGen框架的复现数据,包含用于评估大语言模型(LLM)代码能力的测试数据。数据集包含3个JSON格式的精选测试集和1个压缩的原始数据归档,覆盖代码摘要、代码补全等软件工程项目任务,支持LLM代码生成能力的验证与分析。 文件详解 精选测试集文件(JSON格式)...
    packageimg
  • SO_GitHub_Based代码片段使用与归因研究补充材料

    2026年1月29日 30 199 52

    数据集概述 本数据集是《Usage and Attribution of Stack Overflow Code Snippets in GitHub Projects》的补充材料,聚焦Stack...
    packageimg
  • GitHub_Test_Reviews_开发者测试评审分析数据集

    2026年1月28日 30 56 11

    数据集概述 本数据集记录了GitHub平台上330条测试相关的代码评审数据,包含40个评审建议、16个请求类别、8个响应类别,以及13个拉取请求和评论特征。数据集通过结构化字段整合了项目信息、评审内容、测试类型等维度,为分析开发者测试评审行为提供支持。 文件详解 文件名称:Test Reviews v1.csv 文件格式:CSV...
    packageimg
  • CodeSmell_Based_C_长方法与大类代码异味人工标注数据集

    2026年1月26日 30 156 106

    数据集概述 本数据集包含采用C#编程语言编写的开源项目代码,针对长方法(Long Method)和大类(Large Class,文中亦称God Class)两种代码异味进行人工标注。每个标注实例由至少两名标注员独立完成,数据集包含标注结果及标注依据的启发式信息,共4个Excel文件,可用于代码异味检测模型训练与评估、代码质量分析等场景。 文件详解...
    packageimg
  • MSR_2019_Based_JavaScript代码片段规则违规挖掘数据集

    2026年1月20日 30 104 56

    数据集概述 本数据集为MSR 2019挖掘挑战赛的配套资源,包含从Google BigQuery获取的JavaScript代码片段原始数据、代码提取与ESLint检测脚本,以及规则违规统计结果。数据覆盖代码块内容、长度等基础信息,通过ESLint分析生成规则违规分类统计与单条报告,支持JavaScript代码质量相关研究。 文件详解 原始数据集文件...
    packageimg
  • 堆栈飞行员_StackPilot_源代码堆栈溢出与GitHub_Copilot代码片段对比数据集

    2026年1月9日 30 146 34

    数据集概述 本数据集旨在支持对Stack Overflow复制粘贴代码与GitHub Copilot生成代码的系统性对比分析。包含针对2,636个相同查询/提示的30,746条代码片段,覆盖两种查询/提示式编程模型的输出结果,为研究代码生成工具性能与差异提供基础数据。 文件详解 文件名称:stackpilot.json 文件格式:JSON...
    packageimg
  • Replication_package_Based_代码可理解性指标对代码理解影响研究_ICSE21_复制包

    2025年12月30日 30 44 25

    数据集概述 本数据集是论文《The Mind Is a Powerful Place: How Showing Code Comprehensibility Metrics Influences Code...
    packageimg
  • 软件质量观点随时间差异研究与实践视角复现包

    2025年12月22日 30 193 183

    数据集概述 本数据集是一个复现包,围绕软件质量的理论与实践视角随时间的差异展开,核心内容为代码片段质量相关的观点研究资料,通过压缩包形式整合存储。 文件详解 该数据集包含一个压缩包文件,具体说明如下: - 文件名称: replicationPkg.zip - 文件格式: ZIP (.zip) - 文件内容:...
    packageimg
  • 开发者与ChatGPT对话数据集2023

    2025年12月22日 30 11 1

    数据集概述 该数据集是经过整理的开发者与ChatGPT对话数据集,包含一万七千九百一十三条提示词及ChatGPT的回复(含一万一千七百五十一个代码片段),并关联了源代码、提交记录、问题、拉取请求、讨论及Hacker News帖子等软件开发工件,为分析开发者与ChatGPT交互的背景及影响提供支持。 文件详解 文件名称: DevGPT.zip 文件格式:...
    packageimg
  • 测试异味处理策略多方法研究数据集

    2025年12月20日 30 8 2

    数据集概述 该数据集是针对软件测试异味处理策略的多方法研究数据,包含对八十七名软件测试人员的调查结果、测试代码片段示例及八份访谈转录文本,聚焦八种测试异味类型,探究开发者对测试代码创建与维护策略的感知。 文件详解 文件名称: Respostas Válidas Survey.xlsx 文件格式: XLSX 内容说明:...
    packageimg
  • LLM生成代码片段可读性对比数据集

    2025年12月19日 30 75 57

    数据集概述 本数据集聚焦LLM生成代码片段的可读性研究,包含ChatGPT、DeepSeek、Gemini三款模型生成代码的对比分析相关文件,以压缩包形式提供,为探究不同大语言模型代码生成质量差异提供数据支持。 文件详解 文件名称:Replication Package.zip 文件格式:ZIP(压缩包格式)...
    packageimg
  • NPM生态系统拉取请求接受预测数据集2020

    2025年12月4日 30 164 20

    数据集概述 该数据集包含470,925条NPM生态系统拉取请求数据及预训练随机森林模型,围绕技术与社会因素对拉取请求质量的影响展开,为预测拉取请求接受情况提供数据与模型支持,对应ESEM-2020相关研究论文。 文件详解 文件名称:Curated_Pull_Request_Data.csv 文件格式:CSV...
    packageimg
  • Pythonic函数式构造可理解性研究复现数据包

    2025年12月15日 30 82 70

    数据集概述 本数据集是《Pythonic函数式构造可理解性研究》论文的复现数据包,包含实验材料、原始/处理数据及分析脚本,支持复现论文中关于Python函数式构造对代码可理解性影响的控制实验结果,数据已匿名化处理。 文件详解 该数据集由多个目录和文件组成,具体说明如下: - 实验材料目录(Experiment-Material/): - Google-...
    packageimg
  • 美国地区Stack_Overflow代码片段质量分析复现包

    2025年12月14日 30 43 42

    数据集概述 本数据集为复现包,围绕美国不同地区Stack Overflow代码片段的质量展开研究,分析SQL、JavaScript等五种语言片段在可靠性、可读性等维度的表现,探究地域多样性指标与代码质量违规的关联,并通过定性分析补充质量维度。 文件详解 文件名称:Replication Package.zip 文件格式:ZIP压缩包...
    packageimg
  • 代码异味数据集_DACOS

    2025年12月10日 30 75 20

    数据集概述 该数据集提供三类代码异味(多面抽象、复杂方法、长参数列表)的标注代码片段,包含人工标注的主观片段数据集及更大规模的明确良性或异味的代码片段集,通过SQL文件和源码压缩包形式存储。 文件详解...
    packageimg
  • 认知驱动开发与代码可读性关联研究数据集

    2025年12月10日 30 41 24

    数据集概述 本数据集围绕认知驱动开发(CDD)对代码可读性的影响展开研究,包含专业开发者问卷投票结果及代码片段可读性评估数据,记录了十组CDD重构代码与原始代码的对比反馈及模型分析结果,为探究CDD设计实践的实际效果提供支撑。 文件详解 README.txt:...
    packageimg
  • 代码注释对Stack_Overflow帖子感知有用性影响数据集

    2025年12月9日 30 33 27

    数据集概述 本数据集围绕代码注释对Stack Overflow帖子感知有用性的影响展开,包含91名参与者的在线实验数据、问卷文档等,旨在分析不同类型代码注释对开发者(尤其是新手)感知帮助度的作用。 文件详解...
    packageimg
  • 莱比锡大学_DIGITAL_ORGANOLOGY_Based_musiXplora数据检索说明完整文档

    2025年12月9日 30 118 81

    数据集概述 本数据集为musiXplora结构化数据访问的说明文档,介绍了该音乐学与乐器学关联知识库在Zenodo平台的持久化访问方式,包含多语言代码片段以辅助数据检索,当前仅提供德文版本,后续计划扩展翻译内容。 文件详解 文件名称:...
    packageimg
  • Stack_Overflow代码片段生成问题标题论文数据集

    2025年12月7日 30 202 103

    数据集概述 该数据集是论文《Generating Question Titles for Stack Overflow from Mined Code Snippets》的配套数据,内容为从Stack Overflow数据转储中提取的代码片段及相关信息,用于支持代码片段生成问题标题的研究。 文件详解 文件名称: Code2Que-data.zip...
    packageimg