数据集概述
本数据集为Wikidata的RDF格式数据转储,由wdumps工具生成。包含4个文件,涵盖配置信息、规格说明、压缩数据及预览数据,可用于知识图谱相关研究与应用。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段,记录转储的基础元信息
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、meta、entities、statements、languages、sitelinks、labels、aliases、descriptions字段,记录转储工具的配置规格
- wdump-433.nt.gz
- 文件格式:GZ压缩文件
- 内容说明:压缩的RDF数据文件
- preview.nt
- 文件格式:NT
- 内容说明:RDF数据预览文件
适用场景
- 知识图谱构建:基于RDF格式数据构建或补充Wikidata知识图谱
- 语义网研究:分析Wikidata的RDF数据结构与语义关系
- 数据转储工具测试:验证wdumps工具生成的Wikidata转储数据质量
- 知识工程应用:提取Wikidata中的实体、属性及关系信息用于相关应用开发