数据备份_Wikidata数据集

数据集概述

本数据集为Wikidata的RDF格式转储数据,由wdumps工具生成,包含实体、声明、三元组等结构化信息,共4个文件,覆盖JSON、压缩包、NT等格式,可用于Wikidata数据的备份、分析与应用开发。

文件详解

  • 配置与元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、labels、version、sitelinks、meta、aliases、descriptions、entities等配置字段
  • 数据文件
  • 文件名称:wdump-117.nt.gz
  • 文件格式:GZ压缩包
  • 字段映射介绍:压缩后的NT格式RDF数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:未压缩的NT格式RDF预览数据文件

适用场景

  • Wikidata数据备份与迁移: 用于Wikidata知识图谱数据的离线存储与跨平台迁移
  • 知识图谱研究与分析: 基于RDF格式数据开展知识图谱构建、查询与语义分析
  • 数据格式转换测试: 验证NT、JSON等格式在知识图谱数据存储中的适用性
  • 工具开发与验证: 为wdumps等Wikidata数据处理工具提供测试数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.1 MiB
最后更新 2026年2月12日
创建于 2026年2月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。