数据导出_Wikidata_RDF转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、陈述和三元组等语义网数据结构,共4个文件,覆盖JSON、GZ压缩、NT等格式,可用于语义网相关的存储与交换场景。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基础元信息
  • wdump-181.nt.gz
  • 文件格式:GZ压缩
  • 内容说明:NT格式的RDF数据压缩文件,存储语义网三元组数据
  • preview.nt
  • 文件格式:NT
  • 内容说明:NT格式的RDF预览数据文件
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、labels、version、sitelinks、meta、aliases、descriptions、entities等键,定义转储数据的结构规范

适用场景

  • 语义网数据存储与交换: 用于RDF格式数据的存储、传输和共享,支持语义网技术应用
  • 知识图谱构建与分析: 基于Wikidata的RDF数据构建知识图谱,开展关联分析与知识挖掘
  • 数据格式转换研究: 探索RDF与其他数据格式的转换方法,优化数据互操作性
  • 语义网工具测试: 作为测试数据验证语义网工具对RDF格式的处理能力
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月2日
创建于 2026年2月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。