Wikidata_Dump_RDF格式数据转储_基础数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式数据转储,包含4个文件,涵盖数据描述、配置规范、预览数据及压缩数据等内容。数据涉及实体、陈述、三元组等知识图谱核心要素,可用于Wikidata数据的存储、交换与分析,为知识图谱相关研究和应用提供基础数据支持。

文件详解

  • 数据描述文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录数据转储的基本信息和统计指标
  • 配置规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、descriptions、entities、sitelinks、labels、version、meta、aliases等字段,定义数据转储的配置规范
  • 预览数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF格式的预览数据文件,展示数据的基本结构和内容
  • 压缩数据文件
  • 文件名称:wdump-962.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的RDF格式数据文件,包含Wikidata的核心数据内容

适用场景

  • 知识图谱数据存储与交换: 用于Wikidata数据的标准化存储和跨系统数据交换
  • 知识图谱构建与分析: 为知识图谱的构建、更新及相关分析提供基础数据
  • 语义网技术研究: 支持语义网相关技术(如RDF数据处理、SPARQL查询等)的研究与应用
  • 数据工具开发测试: 为Wikidata数据处理工具(如转储、解析、可视化工具)的开发和测试提供样本数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.17 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。