-
The_Beauty_Survey_审美研究数据与分析代码集
2026年1月29日 30 200 49
数据集概述 本数据集包含The Beauty Survey研究项目的相关数据及分析代码。数据以压缩包形式存储,包括研究中收集的数据文件、图像映射文件、代码脚本等,支持复现论文中的分析结果与图表生成,适用于审美研究领域的数据分析与验证。 文件详解 Readme.md 文件格式:MD...
-
Tubitak_1001_Based_代码分析数据集
2026年1月31日 30 22 19
数据集概述 本数据集为Tubitak-1001项目相关的代码分析数据集,包含两个压缩文件,主要用于代码分析相关的研究或应用场景,提供代码输入及相关数据资源。 文件详解 文件名称:apache_inputs_with_code_large.zip 文件格式:ZIP 字段映射介绍:未提供具体字段信息,推测包含与Apache相关的代码输入数据及相关资源...
-
共和国大学计算机工程学院_代码异味研究数据_毕业设计用途
2026年1月30日 30 42 41
数据集概述 本数据集为乌拉圭共和国大学计算机工程专业毕业设计的研究用数据,包含精选的代码异味(Code Smells)信息,用于支持设计缺陷分析。数据集共2个文件,均为XLSX格式,无目录结构,未划分训练/测试集或数据/标签集。 文件详解 文件名称:Code Smells seleccionados para la investigación.xlsx...
-
Java_8_Streams_Based_使用与误用实证研究数据集
2026年1月27日 30 42 38
数据集概述 本数据集为Java 8 Streams使用与误用实证研究的原始数据,基于34个Java项目、553万行代码及719个手动检查补丁分析生成,涵盖流操作的使用模式、并行化决策及相关缺陷特征,包含11个文件,以CSV格式为主。 文件详解 文档文件 文件名称:README.md 文件格式:MD 字段映射介绍:数据集说明文档,列出各文件用途及字段注释...
-
复现包_基于OpenAI的嵌入语义代码审查评论相似度实证分析_2025
2026年1月23日 30 119 16
数据集概述 本数据集是SEAA 2025会议论文《OpenAI嵌入在语义代码审查评论相似度中的实证分析》的复现包,包含所有人工标注数据及可复现论文结果和图表的Jupyter笔记本,共4个文件,支持研究人员验证和扩展相关分析。 文件详解 人工标注数据文件...
-
Variable_Misuse_tool_Based_数据增强训练数据集
2026年1月22日 30 36 30
数据集概述 本数据集用于Variable Misuse工具训练阶段的数据增强,包含从第三方仓库提取的源代码文件,支持工具模型训练过程中的数据补充。数据集仅含一个压缩文件,无目录层级划分,未区分训练/测试、数据/标签及原始/处理数据类型。 文件详解 文件名称:varmisuse_data-augmentation6.zip 文件格式:ZIP...
-
dspinellis_Based_软件复合年增长率研究复制数据包_v1_0
2026年1月21日 30 102 85
数据集概述 本数据集是论文《The long-term growth rate of evolving software: Empirical results and...
-
Atoms_of_Confusion_Java_开源项目混淆原子检测数据集
2026年1月21日 30 146 85
数据集概述 本数据集是Java程序中混淆原子的双重校验黄金标准数据集,从四个开源项目(FastUtil、Moshi、Jimfs、uCrop)的主源代码包中提取(排除测试文件),同时包含从Guava和Redisson两个开源项目中提取的样本数据,为Java代码混淆模式研究提供结构化参考。 文件详解 主文件 文件名称:Dataset.zip...
-
MDCK_Tissue_Based_定向有序上皮组织生物力学研究数据_2025
2026年1月19日 30 47 44
数据集概述 本数据集包含用于确定MDCK上皮组织薄膜定向概率分布的代码与所需数据,支持Proc. R. Soc. A 2025年同名论文的研究验证,共包含2个文件,无目录层级。 文件详解 数据文件 文件名称:test.xlsx 文件格式:XLSX...
-
Replication_Package_Source_软件演化粘性评分评估复制包数据
2026年1月18日 30 108 20
数据集概述 本数据集是“用粘性评分评估软件演化:跨文件、文件夹和开发者的代码持久性评估”研究的复制包,包含Devotion系统前后端源码及假设测试相关数据与代码,用于复现研究中的软件演化分析与假设验证过程。 文件详解 压缩包文件 文件名称:Replication_Package.zip 文件格式:ZIP...
-
TOSEM_Replication_基于GitHub拉取请求反应的实证研究复现包数据
2026年1月18日 30 197 167
数据集概述 本数据集是TOSEM论文《GitHub拉取请求反应的实证研究》的复现包,包含从GitHub平台前一万个星标最多的仓库及六个选定仓库(Cataclysm-DDA、Julia、Laravel、Node、RPCS3、Rust)收集的原始数据,以及用于数据收集、分析和论文图表生成的源代码,支持研究结果的完整复现。 文件详解...
-
Guided_Pattern_Mining_API误用检测研究复制包数据2021
2026年1月15日 30 54 2
数据集概述 本数据集是论文“Guided Pattern Mining for API Misuse Detection by Change-Based Code Analysis”的复制包,包含研究中使用的数据集和脚本。由德国马格德堡奥托-冯-格里克大学计算机科学学院的作者提供,用于支持API误用检测相关研究的可重复性验证。 文件详解...
-
FASTTypescript_Based_TypeScript示例代码AST表示数据集
2026年1月14日 30 72 13
数据集概述 本数据集包含通过Pharo中的新项目FASTTypescript解析并表示为抽象语法树(AST)的Typescript示例代码。示例涵盖来自开源项目的小型、基础、复杂及超长代码,可用于研究Typescript代码结构及AST表示。 文件详解 文件名称:Typescript examples.xlsx 文件格式:XLSX...
-
Two_Class_Dependency_Cycle_Based两类依赖循环实证研究数据
2026年1月13日 30 6 2
数据集概述 本数据集为两类依赖循环的实证研究数据,包含三个文件夹:recurring-patterns(成功解耦案例)、common-mistakes(未正确解决的依赖循环案例)、design-characteristics(循环文件的内部依赖关系及设计背景CSV文件)。数据集以压缩包形式提供,用于分析代码依赖循环的解耦模式、常见错误及设计特征。...
-
LAMeD_Supplementary_Materials_LLM生成内存泄漏检测标注数据
2026年1月12日 30 13 6
数据集概述 本数据集是LAMeD项目的补充材料,包含LLM生成的内存泄漏检测标注相关文件,用于支持内存泄漏检测任务的研究与分析。数据集共3个文件,涵盖管道代码、标注CSV及基准测试JSON三类内容,无训练测试或数据标签拆分。 文件详解 文件名称:lamed-pipeline.zip 文件格式:ZIP...
-
ICSA2024_Replication_Package_废弃Web_API检测实验复现数据
2026年1月12日 30 41 14
数据集概述 本数据集是ICSA 2024会议论文《Detecting Usage of Deprecated Web APIs via Tracing》的复现包,包含论文实验所需的全部资源。数据集记录了从v1到v3的版本更新内容,包括数据文件补充、工具功能扩展及项目文件优化,支持研究人员复现废弃Web API检测实验。 文件详解...
-
COLARE_Commit_Classification_代码变更细粒度上下文感知表示分类数据
2026年1月11日 30 199 155
数据集概述 本数据集为COLARE相关的代码变更提交分类数据,核心围绕代码变更的细粒度上下文感知表示展开,用于支持提交分类任务。数据集仅包含一个压缩文件,无额外目录结构,未划分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:COLARE.zip 文件格式:ZIP(压缩文件)...
-
poojaruhal_Replication_package_类注释分析复现数据_v1_0_0
2026年1月11日 30 134 42
数据集概述 本数据集为类注释分析项目的复现包,包含复现该项目所需的必要材料及补充数据,可帮助使用者深入理解项目结果。数据集以压缩包形式存在,无训练测试、数据标签或原始/处理数据的拆分,目录结构简单。 文件详解 压缩包文件 文件名称:poojaruhal/RP-class-comment-analysis-v1.0.0.zip 文件格式:ZIP...
-
AuNoteDaS_Replication_Package_数据科学项目自动化笔记本生成工具复制包
2026年1月7日 30 192 128
数据集概述 本数据集是论文《AuNoteDaS: a tool to support automated notebook generation for data science projects》的复制包,包含工具源代码、原始Python脚本数据集及用户研究结果,共3个文件,支持复现论文研究内容。 文件详解 Questionnaire on the...
-
Stack_Overflow协作者回答数量代码质量违规与辍学者综合预测分析复现包
2025年12月22日 30 134 66
数据集概述 本数据集为Stack Overflow案例研究的复现包,围绕协作者回答数量、代码质量违规及辍学者状态三个任务,对21种算法进行评估,包含数据预处理方法(如归一化、标准化等)及CodeBERT模型微调等研究相关材料。 文件详解 文件名称: Replication Package.zip 文件格式: ZIP压缩包 内容说明:...



