Wikidata_Partial_RDF_Dump_Based_wdumps_知识图谱数据转储

数据集概述

本数据集是使用wdumps工具生成的Wikidata部分RDF转储数据,包含实体、陈述和三元组相关信息。数据集总文件数4个,涵盖JSON、GZ压缩文件和NT格式文件类型,主要用于Wikidata知识图谱的部分数据提取与应用。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息
  • wdump-1045.nt.gz
  • 文件格式:GZ压缩文件
  • 内容说明:压缩的NT格式RDF数据文件
  • preview.nt
  • 文件格式:NT
  • 内容说明:未压缩的NT格式RDF预览数据文件
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta等字段,记录转储工具的配置规范

适用场景

  • 知识图谱研究:用于分析Wikidata知识图谱的结构与内容
  • 数据转储技术验证:验证wdumps工具生成RDF转储的有效性
  • 小批量知识数据应用:基于部分Wikidata数据开展特定场景的知识服务应用
  • 数据格式转换研究:探索RDF格式与其他数据格式的转换方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月11日
创建于 2026年1月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。