找到14个数据集

分类: 公开数据 标签: Java项目

过滤结果
  • Eclipse_Based_10个Java项目静态分析函数调用数据

    2026年1月27日 30 109 9

    数据集概述 本数据集包含Eclipse JDT Core对10个Java项目进行静态分析的结果,覆盖每个项目的方法声明、函数调用序列及补全建议。数据以JSON和TXT格式存储,总计30个文件,用于函数调用补全相关研究。 文件详解 JSON文件(10个) 文件名称:遵循“[项目名]_eclipse.json”模式(如game-of-...
    packageimg
  • Java_8_Streams_Based_使用与误用实证研究数据集

    2026年1月27日 30 171 45

    数据集概述 本数据集为Java 8 Streams使用与误用实证研究的原始数据,基于34个Java项目、553万行代码及719个手动检查补丁分析生成,涵盖流操作的使用模式、并行化决策及相关缺陷特征,包含11个文件,以CSV格式为主。 文件详解 文档文件 文件名称:README.md 文件格式:MD 字段映射介绍:数据集说明文档,列出各文件用途及字段注释...
    packageimg
  • SAT_Effectiveness_开源静态分析工具有效性评估数据

    2026年1月27日 30 36 23

    数据集概述 本数据集为开源静态分析工具(SATs)的有效性评估数据,包含PMD、SpotBugs、SonarLint和Infer四款工具对35个Java项目的分析结果,记录各工具识别的真阳性、假阳性、真阴性、假阴性数量,可用于计算工具的精确率和召回率,评估其在检测空指针异常(NPE)相关缺陷中的性能。 文件详解 文件名称:Effectiveness...
    packageimg
  • WoC_Based_MSR_2023挑战赛Bug修复提交研究复制包数据

    2026年1月23日 30 99 2

    数据集概述 本数据集是MSR 2023挑战赛提交论文“Studying Bug-Fixing Commits in the WoC Dataset”的复制包,包含Python和Java项目相关的Bug修复提交数据,共2个JSON文件,用于复现论文研究结果。 文件详解 Python项目数据文件 文件名称:PythonProjects.json...
    packageimg
  • Fork_Including_Based开源软件开发分叉轨迹挖掘数据集

    2026年1月23日 0 131 84

    数据集概述 本数据集关联论文《Mining Fork-Including Development Traces》,包含880个Java开源项目的开发轨迹数据,涉及分叉相关的事件记录、项目信息及轨迹变体等内容,支持对分叉类型预测及用户参与度影响的分析。 文件详解 readme.txt(TXT格式):说明数据集关联的论文、作者及各文件内容概述。...
    packageimg
  • project_KB_Source_Java漏洞引入提交数据集_2021

    2026年1月22日 30 19 4

    数据集概述 本数据集基于project-KB,通过改进的两阶段SZZ算法生成,包含Java项目的漏洞引入提交数据,同时附带自动化处理流程的两个工具FilterBugIntroder和BugIntroducer,为Java软件漏洞分析提供结构化数据支持。 文件详解 文件名称:vuln_introducing_2021.zip 文件格式:ZIP...
    packageimg
  • Software_test_smell_开发者经验对测试代码质量影响_研究数据

    2026年1月19日 30 209 73

    数据集概述 本数据集为开发者经验对软件测试代码质量影响的实证研究数据,聚焦测试坏味(test smells)的插入与移除情况。研究覆盖4个开源Java项目,包含386个测试类、5178个测试坏味,分析核心与外围开发者在测试坏味生成和消除中的作用,以及测试坏味在项目演化中的变化规律。 文件详解 文档文件 文件名称:Readme.docx...
    packageimg
  • Casting_Artifact_Evaluation_Java项目类型转换模式研究数据集

    2026年1月12日 30 109 93

    数据集概述 本数据集是论文“Casting about in the Dark”的配套工件,包含对七千多个Java项目中类型转换使用情况的实证研究数据。数据聚焦开发者如何绕过静态类型系统使用动态类型转换,统计了转换的使用频率、未受保护转换的占比,并识别出25种转换使用模式,为语言设计、工具开发等提供参考。 文件详解 文件名称:java-cast-...
    packageimg
  • TD_Tools_Agreement_Evaluation_Based_技术债务测量工具一致性评估实证基准数据

    2025年12月28日 30 195 42

    数据集概述 本数据集包含来自三个技术债务(TD)测量工具的文件级TD测量数据,是原型分析的输入数据。数据集共包含2个文件,均为.xlsx格式,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集,可用于技术债务测量工具的一致性评估研究。 文件详解 文件名称:dataset_java_25.xlsx 文件格式:XLSX...
    packageimg
  • 行业与开源软件自我承认技术债务实践比较研究数据集

    2025年12月23日 30 96 77

    数据集概述 本数据集为论文《Self-Admitted Technical Debt Practices: A Comparison Between Industry and Open-Source》的配套数据,包含行业与开源场景下自我承认技术债务实践的调查、访谈及项目选择数据,覆盖多编程语言项目,为软件工程领域技术债务研究提供实证数据支持。 文件详解...
    packageimg
  • ATL模型转换性能预测数据集

    2025年12月21日 30 6 1

    数据集概述 该数据集围绕ATL模型转换的性能预测展开,包含实验所需的原始及处理后输入数据、实验复现脚本与结果。通过机器学习方法(线性回归、随机森林等),基于输入模型特征预测转换执行时间,为模型转换性能测试提供数据支持。 文件详解 文件名称: README.md:Markdown格式文档,包含数据集简介与快速入门指南,说明实验背景与使用方法。 文件名称:...
    packageimg
  • 开源库维护者社区分析支持数据集

    2025年12月20日 30 186 34

    数据集概述 本数据集为支持开源库维护者的社区分析研究提供复现包,包含数据、脚本及工具组件,覆盖数据收集、方法解析、覆盖率分析等流程,支持研究问题的验证与扩展。 文件详解 该数据集以压缩包形式提供,内部包含五个核心组件,具体说明如下: - 数据目录(Data): - ProcessedData:包含用于研究问题分析的精炼数据集 -...
    packageimg
  • 基于机器学习的技术债务优先级排序数据集

    2025年12月15日 30 96 58

    数据集概述 该数据集围绕技术债务优先级排序展开,通过GitHub上Java开源项目的2616份调查响应构建,包含"是否偿还""3分类""优先级"三种标签策略的数据,用于训练预测技术债务偿还决策的机器学习模型。 文件详解 文档文件(PDF格式): research_web_consent-...
    packageimg
  • MLCQ工业相关代码异味数据集

    2025年12月9日 30 132 31

    数据集概述 该数据集包含约一万五千个代码样本,由具有专业经验的软件开发者基于行业相关的当代Java开源项目评审创建,旨在研究开发者背景与代码异味感知的关系,相比基于旧代码的数据集具有更持久的相关性。 文件详解 代码样本数据文件:...
    packageimg