Wikidata_Based_CC_1测试转储数据

数据集概述

本数据集是使用wdumper工具生成的Wikidata RDF格式测试转储数据,包含4个文件,实体数、陈述数和三元组数均为零。文件类型涵盖JSON、GZ压缩包和NT格式,主要用于验证Wikidata转储工具的输出结构和格式,为正式数据转储提供测试参考。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等键值对,记录转储的基本元信息
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等键值对,定义转储的配置规范
  • wdump-2465.nt.gz
  • 文件格式:GZ压缩包
  • 内容说明:压缩的NT格式RDF数据文件
  • preview.nt
  • 文件格式:NT
  • 内容说明:NT格式的预览数据文件

适用场景

  • Wikidata转储工具测试: 验证wdumper工具生成RDF转储的格式正确性和结构完整性
  • 语义网数据处理测试: 用于测试RDF数据解析、存储和查询工具对Wikidata格式的兼容性
  • 数据转储流程验证: 模拟正式Wikidata转储流程,验证数据输出、压缩和元数据记录的准确性
  • 开源工具开发参考: 为开发Wikidata相关数据处理工具提供标准测试数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 58.58 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。