找到15个数据集

标签: 开源项目分析

过滤结果
  • CodePori_Based_多智能体自主软件开发项目完整数据集

    2026年1月28日 30 91 81

    数据集概述 本数据集为论文“CodePori: A Large-Scale System for Autonomous Software Development Using Multi-Agents”的配套数据,记录于单个Excel文件中,包含20个选定项目的描述、修改详情、输出结果及失败项目数据,用于支持多智能体自主软件开发系统的研究与分析。...
    packageimg
  • Smells_开源项目代码坏味道引入实证研究数据

    2026年2月9日 30 47 32

    数据集概述 本数据集围绕代码坏味道引入问题展开,基于200个开源项目的变更历史,通过识别坏味道引入提交、挖掘超50万次提交并手动分析9164次相关提交,探究开发者引入坏味道的时间、场景及原因,为代码质量优化提供实证依据。 文件详解 文件名称:smell-introduction.zip 文件格式:ZIP...
    packageimg
  • SATD_Based_开源项目问题跟踪系统技术债务实例数据

    2026年1月30日 30 197 71

    数据集概述 本数据集包含从微软Visual Studio、GitLab Community Edition等5个开源项目中收集的286个基于问题跟踪系统的自承认技术债务(SATD-I)实例。数据用于研究SATD-I的来源、处理周期、引入原因及类型分布,为技术债务管理工具设计提供实证支持。 文件详解 文件名称:Beyond the Code_Mining...
    packageimg
  • Myriad_People_新媒体艺术开源项目及贡献者数据集

    2026年1月29日 30 156 0

    数据集概述 本数据集聚焦新媒体艺术领域,收录9件参展艺术作品所使用的124个开源项目及其所有贡献者信息。数据来源于斯德哥尔摩“myriad”展览相关的艺术家开源征集,覆盖新媒体艺术创作涉及的多软件层,为研究新媒体艺术背后的技术生态提供支持。 文件详解 repos_info.json:JSON格式,记录124个开源项目的基础信息...
    packageimg
  • Acceptance_Criteria_Based_验收标准实践创建与使用研究数据

    2026年1月15日 30 151 93

    数据集概述 本数据集包含2021年开展的验收标准实践研究相关材料,涵盖访谈研究问卷及开源项目用户故事验收标准评估数据,共2个文件,可用于分析软件开发中验收标准的实际应用情况。 文件详解 Questionnaire on the use and application of acceptance criteria.docx 文件格式:DOCX...
    packageimg
  • Microservices_Issues_Empirical_Study_Dataset

    2026年1月13日 30 179 137

    数据集概述 本数据集是微服务系统问题、原因及解决方案实证研究的配套数据,记录于Excel文件中。包含15个开源微服务系统的筛选过程数据、问题原始数据、两轮筛选后的问题列表、初始编码、访谈与调查问卷及结果,以及问题、原因、解决方案的详细分类体系,支持微服务系统相关研究与分析。 文件详解 文件名称:Dataset.xlsx 文件格式:XLSX...
    packageimg
  • Java_Subjects_Based_Java_8_Streams智能并行化安全自动重构评估用开源项目源码

    2025年12月29日 30 16 6

    数据集概述 本数据集包含用于评估Java 8 Streams智能并行化安全自动重构的开源Java项目源码,所有项目已打包为Eclipse项目格式。数据集以压缩包形式提供,内含构建说明和许可信息文档,可支持重构方法的有效性验证与性能评估。 文件详解 Java-Subjects-master.zip 文件格式:ZIP...
    packageimg
  • 行业与开源软件自我承认技术债务实践比较研究数据集

    2025年12月23日 30 47 36

    数据集概述 本数据集为论文《Self-Admitted Technical Debt Practices: A Comparison Between Industry and Open-Source》的配套数据,包含行业与开源场景下自我承认技术债务实践的调查、访谈及项目选择数据,覆盖多编程语言项目,为软件工程领域技术债务研究提供实证数据支持。 文件详解...
    packageimg
  • SANER2020游戏引擎与框架数据集

    2025年12月22日 30 84 12

    数据集概述 该数据集是SANER2020会议论文配套数据,包含游戏引擎与框架相关的调查数据、数据集文件及分析代码,覆盖引擎项目背景、开发者经验等信息,为相关研究提供支持。 文件详解 数据文件:...
    packageimg
  • 基于机器学习的技术债务优先级排序数据集

    2025年12月15日 30 192 118

    数据集概述 该数据集围绕技术债务优先级排序展开,通过GitHub上Java开源项目的2616份调查响应构建,包含"是否偿还""3分类""优先级"三种标签策略的数据,用于训练预测技术债务偿还决策的机器学习模型。 文件详解 文档文件(PDF格式): research_web_consent-...
    packageimg
  • ICSE2024提交论文1725的复现数据包

    2025年12月12日 30 43 29

    数据集概述 该数据集是ICSE 2024会议提交论文1725的复现数据包,围绕软件解耦的研究主题,包含结构化数据文件、图表文件等,为论文研究内容提供可复现的数据支持。 文件详解...
    packageimg
  • 废弃库文本识别提示词数据集

    2025年12月10日 30 37 36

    数据集概述 本数据集为用于识别废弃库文本的提示词集合,包含基于项目描述和README文件设计的提示词,支持相关文本分类任务。 文件详解 prompt.zip: 压缩包格式,包含以下文件 description_classification.md: Markdown格式,含基于项目描述识别废弃库的提示词 README_classification.md:...
    packageimg
  • GitHub问题生成的LLM软件需求数据集

    2025年12月9日 30 163 29

    数据集概述 该数据集包含基于GitHub五个开源仓库(pytorch/pytorch等)的功能请求,由o3-mini和deepseek-r1-distill-llama-70b两个LLM通过三种提示策略生成的软件需求,以及qwen-qwq-32b模型对需求质量的评估结果,可用于分析生成模型和提示技术对需求质量的影响。 文件详解 数据文件:...
    packageimg
  • 代码变更质量问题识别与评审反馈分析数据集2024

    2025年12月5日 30 165 93

    数据集概述 该数据集为提交至ENASE 2024的论文配套数据,包含用于分析代码变更中常见质量问题的评审反馈数据,以及数据提取、预处理的Python脚本,支持对代码评审反馈与质量问题关联的研究。 文件详解 数据文件: Jabref_pullrequest_comments.xlsx: XLSX格式,可能包含JabRef项目的拉取请求评审反馈原始数据...
    packageimg
  • GitHub热门开源项目分析数据集GitHubHotOpenSourceProjectsAnalysis-jaimevalero

    2025年4月29日 30 82 18

    GitHub热门开源项目分析数据集GitHubHotOpenSourceProjectsAnalysis-jaimevalero 数据来源:互联网公开数据 标签:GitHub, 开源项目, 软件工程, 项目分析, 开发者, 编程语言, 社区, 星标 数据概述:...
    packageimg