COCI_Based_出版商缺失引用分析结果数据

数据集概述

本数据集为COCI(开放引用索引)中缺失引用的出版商分析结果,包含通过作者开发软件检索到的结构化数据。数据以JSON格式存储,涵盖出版商列表、有效/无效引用数据、总有效引用数及未识别前缀的外部数据,为学术引用完整性研究提供支持。

文件详解

  • 文件名称:output.json
  • 文件格式:JSON
  • 字段映射介绍:包含四个核心结构:
  • "publishers":出版商列表,每个出版商以字典形式存储
  • "citations":引用数据字典,含"validated"(有效引用列表)和"invalid"(无效引用列表)两个子列表,每条引用为字典格式
  • "total_num_of_valid_citations":数值型字段,代表软件处理过程中验证通过的引用总数
  • "external_data_for_unrecognized_prefixes":未识别前缀的外部数据字典,以嵌套字典形式存储其他在线服务识别的出版商信息

适用场景

  • 学术引用完整性研究:分析COCI中缺失引用的分布特征与成因
  • 出版商引用数据校验:验证不同出版商引用数据的有效性与准确性
  • 学术引用索引优化:为COCI等开放引用索引的引用数据补充与质量提升提供依据
  • 学术出版数据治理:支持出版商学术引用数据的规范化管理与错误修正
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 261.72 MiB
最后更新 2026年2月9日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。