Wikidata数据转储文件数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式数据转储文件,包含实体、声明、三元组等结构化知识图谱信息,共4个文件,覆盖.json、.gz、.nt三种格式,可用于知识图谱构建、语义分析等场景。

文件详解

  • 数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、entities、sitelinks、aliases、version、meta、descriptions、statements等结构化定义字段
  • 文件名称:wdump-191.nt.gz
  • 文件格式:GZ压缩文件
  • 字段映射介绍:RDF格式的Wikidata实体数据压缩包
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF三元组格式的预览数据文件

数据来源

Wikidata平台(通过wdumps工具生成)

适用场景

  • 知识图谱构建: 用于构建基于Wikidata的结构化知识图谱,支持语义查询与关联分析
  • 语义网研究: 基于RDF格式数据开展语义网相关技术研究与应用开发
  • 数据挖掘分析: 利用实体、声明等结构化数据进行知识发现与数据挖掘
  • 工具验证测试: 作为wdumps工具生成数据的示例,用于工具功能验证与测试
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 205.42 MiB
最后更新 2026年2月12日
创建于 2026年2月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。