wdumps_Based_Wikidata_RDF转储数据集

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF格式转储数据,包含4个文件,涉及JSON、GZ压缩、NT等格式,文件结构涵盖元数据、转储规范、压缩数据及预览文件,可用于语义网相关的数据分析与应用开发。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、version、statements、samplingPercent、aliases、meta、sitelinks、descriptions、entities等转储规范字段
  • wdump-1696.nt.gz
  • 文件格式:GZ压缩文件
  • 内容说明:压缩格式的RDF数据文件
  • preview.nt
  • 文件格式:NT
  • 内容说明:RDF数据预览文件

适用场景

  • 语义网数据研究:用于分析Wikidata的RDF数据结构与语义关系
  • 数据转储工具测试:验证wdumps工具生成的RDF转储数据的完整性与规范性
  • 元数据管理分析:基于info.json和wdumper-spec.json的字段信息,开展转储元数据的统计与管理
  • 数据格式转换研究:探索RDF格式数据在不同应用场景下的转换与使用方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。