数据集概述
本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含4个文件,涵盖配置信息、规格说明、预览数据等内容,可用于知识图谱相关的数据处理与分析场景。
文件详解
- 配置信息文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等配置字段
- 规格说明文件
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等规格字段
- 压缩数据文件
- 文件名称:wdump-1808.nt.gz
- 文件格式:GZ
- 预览数据文件
- 文件名称:preview.nt
- 文件格式:NT
适用场景
- 知识图谱数据研究: 分析Wikidata RDF转储数据的结构与内容
- 数据处理工具测试: 用于测试与验证RDF数据处理工具的功能
- 知识图谱构建: 为构建知识图谱提供基础数据支持
- 数据格式转换研究: 研究RDF格式与其他数据格式的转换方法