找到17个数据集

标签: GitHub项目

过滤结果
  • VAPU自主遗留代码现代化评估数据

    2026年2月15日 30 89 70

    数据集概述 本数据集为VAPU(自主遗留代码更新系统)的扩展评估资源与结果数据。VAPU是多智能体系统,可根据项目描述将遗留项目文件自主更新至最新版本。评估包含验证与验证过程,对比零样本(ZSL)、单样本(OSL)学习与VAPU在不同大语言模型(LLM)、温度参数下的表现,数据集含4个表格,共1个文件。 文件详解 文件名称:extended...
    packageimg
  • 基于作者层级指标的关联分析数据

    2026年2月12日 0 208 91

    数据集概述 本数据集用于分析作者层级指标在连续时间窗口中的关联关系,包含16个JSON格式文件,记录了作者在5年连续窗口和后续3年窗口中的各类指标数据,支持学术评价领域的指标关联性研究。 文件详解 数据文件(共16个,均为JSON格式) 文件名称及内容: authors_pac_2lvls_2multi_v3.json:作者层级指标相关数据...
    packageimg
  • SO_GitHub_Based代码片段使用与归因研究补充材料

    2026年1月29日 30 89 54

    数据集概述 本数据集是《Usage and Attribution of Stack Overflow Code Snippets in GitHub Projects》的补充材料,聚焦Stack...
    packageimg
  • LASCAD_showcases_软件分类与相似应用检测数据集

    2026年1月28日 30 179 127

    数据集概述 本数据集包含来自GitHub的103个项目,是LASCAD(语言无关软件分类与相似应用检测)研究的一部分。数据集对项目源代码进行了处理,可作为软件分类和相似应用检测工具的基准数据。 文件详解 文件名称:showcases_out.zip 文件格式:ZIP...
    packageimg
  • OSHW_OSS_Based_残疾人低成本辅助技术系统综述数据集

    2026年1月28日 30 87 49

    数据集概述 本数据集为残疾人低成本辅助技术(AT)系统综述的配套资源,包含155篇相关文献和41个GitHub项目的结构化信息,聚焦开源硬件(OSHW)与开源软件(OSS)在辅助技术中的应用,为研究该领域的技术特征、研究进展及项目实践提供基础数据。 文件详解 文件1:List of studies in SLR.xlsx 文件格式:XLSX...
    packageimg
  • CVulDB_Based_GitHub_C语言项目CVE漏洞提交记录完整数据

    2026年1月20日 30 47 8

    数据集概述 本数据集包含GitHub平台所有C语言项目中涉及CVE漏洞编号的提交记录,以压缩包形式存储,文件大小约125MB。数据按项目所有者和名称构建文件夹结构,每个项目文件夹内存储以"CVE编号_提交哈希"命名的差异文件,可用于C语言项目的漏洞分析与安全研究。 文件详解 文件名称:CVE_Diffs.zip 文件格式:ZIP...
    packageimg
  • VKontakte_Based_189505用户匿名好友连接社交图谱数据

    2026年1月21日 30 103 8

    数据集概述 本数据集包含189505名VKontakte用户的匿名社交关系图谱数据,记录用户间的好友连接关系。数据通过VKontakte官方API分两步采集,用于社交机器人检测研究,文件为JSON格式,大小424.5MB。 文件详解 文件名称:anonymized_graph_data.json 文件格式:JSON...
    packageimg
  • Natural_Language_Guided_Programming_Onward_2021_用户研究数据集

    2025年12月28日 30 102 96

    数据集概述 本数据集为论文《Natural Language-Guided Programming》(Onward! 2021收录)的用户研究数据,包含测试用例、模型预测及标注、训练与评估项目索引四类文件,用于评估自然语言引导的代码预测模型性能,支持相关研究的验证与复现。 文件详解 文件名称:benchmark.json 文件格式:JSON...
    packageimg
  • 开源软件社会公益贡献动机与挑战补充材料

    2025年12月23日 30 153 41

    数据集概述 本数据集是论文《Leaving My Fingerprints: Motivations and Challenges of Contributing to OSS for Social Good》的补充材料,包含支持论文结果复现与扩展的结构化数据、调查文件、访谈协议及项目清单,为研究开源软件社会公益贡献的动机与挑战提供全面数据支持。...
    packageimg
  • 代码审查文件排序研究复现包

    2025年12月23日 30 131 14

    数据集概述 本数据集是论文《Breaking the Alphabet: Rethinking File Ordering in Code Review》的复现包,包含研究相关的说明文档、补充材料及数据集压缩包,支持研究内容的复现与验证。 文件详解 文件名称: readME.txt 文件格式: TXT (.txt) 内容说明:...
    packageimg
  • GitHub热门项目产品特性文档策略探索性研究复现包

    2025年12月21日 30 20 11

    数据集概述 本数据集是针对GitHub热门项目产品特性文档策略的探索性研究复现包,包含研究使用的计算笔记本、会议演示幻灯片等资料,支持对研究结果的验证与复现,聚焦开源软件项目中特性知识的文档方式及与源代码的关联情况。 文件详解 文件名称:puhlfuerss-icsme-2022-replication-package-v4.zip...
    packageimg
  • NCSGgroup_SaGEA_Based_卫星重力误差评估Python包辅助数据

    2025年12月19日 30 21 17

    数据集概述 本数据集是Python包SaGEA(卫星重力误差评估项目)的辅助与验证数据,为该项目提供配套数据支持。 文件详解 文件名称: ddk_data.zip 文件格式: ZIP(压缩文件) 内容说明: 该压缩文件包含Python包SaGEA所需的辅助及验证数据,具体字段与内容需解压后查看,未提供预览信息。 数据来源...
    packageimg
  • Hugging_Face模型文档数据集_偏差与许可证的实证研究论文数据集

    2025年12月14日 30 36 32

    数据集概述 本数据集是论文《How do Hugging Face Models Document Datasets, Bias, and Licenses? An Empirical Study》的复现包,包含研究相关的数据集与脚本,支持复现论文中关于Hugging Face模型文档规范的实证分析结果。 文件详解...
    packageimg
  • 开源GitHub项目代码审查回归分析数据集

    2025年12月9日 30 63 16

    数据集概述 该数据集包含用于研究“现代代码审查与开源项目安全性”的GitHub仓库数据,涵盖三千一百二十六个项目、一百四十三种语言,包含四十八万九千零三十八个问题和三十八万二千七百七十一个拉取请求,以及用于复现结果的回归分析代码文件。 文件详解 数据文件:...
    packageimg
  • HuggingFace机器学习模型文档研究复现数据包

    2025年12月9日 30 124 11

    数据集概述 本数据集是论文《Datasets, Bias, Licenses, and Terms of Use: A Large and Longitudinal Study on the Documentation of Hugging Face Machine Learning...
    packageimg
  • 开源推广的社交媒体反应数据集_AI驱动的GitHub项目在Hacker_News的帖子

    2025年12月8日 30 203 65

    数据集概述 该数据集围绕开源推广的社交媒体反应展开,核心内容为AI驱动的GitHub项目在Hacker News平台上的帖子相关数据,包含论文中的图表等信息,相关研究已被ICSME 2025研究轨道接受。 文件详解 文件名称:SM_Reactions_HN_GH_AI.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • GitHub最受欢迎项目数据集-2023-donbarbos

    2025年4月21日 30 140 119

    GitHub最受欢迎项目数据集-2023-donbarbos 数据来源:互联网公开数据 标签:GitHub,项目,代码仓库,流行度,编程,开源,技术,编程语言,许可证,社区参与,数据科学,项目管理,开发工具 数据概述:...
    packageimg