SWH_Based_UNIBO机构关联代码仓库提取数据集_2024

数据集概述

本数据集为从Software Heritage档案库提取的博洛尼亚大学(UNIBO)关联源代码仓库精选集合,通过关键词搜索与启发式规则筛选,包含仓库URL、修订ID、目录ID及去重作者列表等元数据,支持开放科学、机构仓库分析等研究。

文件详解

  • 文件名称:unibo_repositories_swh.json
  • 文件格式:JSON
  • 字段映射介绍:包含UNIBO关联代码仓库的核心元数据,主要字段包括仓库URL、修订ID、目录ID、去重后的作者列表等;数据集生成过程的溯源信息以结构化JSON文件记录,涵盖初始搜索结果、处理日志、最终筛选结果等阶段数据。

数据来源

Software Heritage档案库(通过其公共REST API提取)

适用场景

  • 开放科学研究:分析学术机构软件产出的开放共享情况与特征
  • 机构代码仓库分析:研究UNIBO关联代码仓库的数量、类型及作者分布规律
  • 软件元数据聚合研究:探索大规模档案基础设施中学术软件元数据的组织与关联模式
  • 学术软件产出表征分析:助力理解学术软件在大型档案库中的呈现形式与覆盖范围
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。