Wikidata_Dump_Kannan_bsx_RDF转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含4个文件,涵盖JSON格式的元数据文件、规范文件、N-Triples格式的预览文件及压缩的RDF数据文件,可用于Wikidata语义数据的分析与应用。

文件详解

  • 元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储数据的基础信息
  • 规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、labels、entities、meta、aliases、languages、sitelinks、descriptions、statements等字段,定义转储数据的结构规范
  • 预览文件
  • 文件名称:preview.nt
  • 文件格式:N-Triples(.nt)
  • 字段映射介绍:N-Triples格式的预览数据文件
  • 压缩数据文件
  • 文件名称:wdump-847.nt.gz
  • 文件格式:Gzip压缩文件(.gz)
  • 字段映射介绍:压缩的N-Triples格式RDF数据文件

适用场景

  • Wikidata语义数据研究: 用于分析Wikidata的RDF数据结构与内容
  • 数据转储工具测试: 验证wdumps工具生成RDF转储数据的正确性与完整性
  • 语义网应用开发: 为语义网相关应用提供Wikidata的RDF数据支持
  • 元数据分析: 通过info.json等文件分析Wikidata转储数据的基础属性与生成信息
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 46.64 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。