Wikidata_Dump_Based实例化专业化过滤RDF数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式过滤数据,包含4个文件,涵盖实例化、专业化相关的结构化信息。数据无实体、陈述及三元组记录,主要提供配置与元数据文件,可用于了解Wikidata数据导出的配置规范及元数据结构。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含descriptions、sitelinks、entities、meta、version、statements、aliases、labels等配置键的对象结构
  • wdump-265.nt.gz
  • 文件格式:GZ压缩文件
  • 内容说明:压缩格式的N-Triples文件
  • preview.nt
  • 文件格式:NT
  • 内容说明:N-Triples格式的预览文件

适用场景

  • 知识图谱工具开发: 用于参考Wikidata数据导出的配置规范(wdumper-spec.json),辅助开发数据处理工具
  • 元数据管理研究: 分析info.json中的元数据字段,研究知识图谱数据导出的元数据记录标准
  • 数据格式转换测试: 基于N-Triples格式文件(wdump-265.nt.gz、preview.nt),测试RDF数据格式转换流程
  • Wikidata数据处理流程优化: 通过数据集了解wdumps工具的输出结构,优化Wikidata数据过滤与导出流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。