数据集概述
本数据集是使用wdumps工具生成的Wikidata瑞典语实体RDF转储数据,包含4个文件,涵盖元数据、配置规范、预览数据及压缩数据文件,无实际实体、陈述或三元组记录,可用于语义网数据处理相关的工具测试或流程验证。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等配置规范字段
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF预览数据文件
- 文件名称:wdump-1095.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩的RDF转储数据文件
适用场景
- 语义网工具测试:用于验证RDF数据处理工具对Wikidata转储格式的兼容性
- 数据转储流程验证:测试wdumps工具生成转储数据的流程完整性
- 元数据结构分析:研究Wikidata转储元数据的标准字段及配置规范
- 压缩数据处理测试:验证压缩RDF文件的解压及读取流程