Wikidata_知识库RDF转储数据

数据集概述

本数据集是使用wdumps工具生成的Wikidata知识库RDF转储数据,包含4个文件,涵盖实体、语句、三元组等结构化信息,以及转储配置和元数据,可用于Wikidata数据的离线分析与集成。

文件详解

  • 配置与元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等转储元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、meta、statements、sitelinks、version、entities、aliases、descriptions等配置键值
  • 数据文件
  • 文件名称:wdump-394.nt.gz
  • 文件格式:GZ压缩文件
  • 字段映射介绍:压缩的N-Triples格式RDF数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:N-Triples格式的预览数据文件

适用场景

  • Wikidata知识库离线分析: 用于在无网络环境下查询和分析Wikidata的实体与属性数据
  • 语义网数据集成: 作为RDF格式数据资源,支持与其他语义网数据集的融合与关联分析
  • 知识库系统构建: 为构建基于Wikidata的知识库应用提供结构化数据源
  • 数据格式转换研究: 用于研究RDF格式(尤其是N-Triples)与其他数据格式的转换方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月10日
创建于 2026年2月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。