Wikidata_RDF_Based语义数据转储文件

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含实体、声明、三元组等语义数据相关内容。数据集包含4个文件,涵盖JSON配置文件、预览文件及压缩数据文件,可用于Wikidata语义数据的分析与处理。

文件详解

  • 配置与信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储工具版本、日期及数据统计信息
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、labels、entities、meta、aliases、languages、sitelinks、descriptions、statements等字段,定义转储数据的结构规范
  • 数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata RDF数据预览文件,包含三元组格式的语义数据
  • 文件名称:wdump-948.nt.gz
  • 文件格式:GZ(压缩包)
  • 字段映射介绍:压缩后的Wikidata RDF转储数据文件,包含完整的三元组数据

适用场景

  • Wikidata语义数据研究: 分析Wikidata的实体、属性及三元组语义关系
  • 语义网技术应用: 基于RDF格式数据开发语义网相关应用与工具
  • 数据转储工具验证: 验证wdumps工具生成的Wikidata转储数据的完整性与准确性
  • 知识图谱构建: 利用转储数据构建或扩展知识图谱,支持知识检索与推理
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。