数据集概述
本数据集是使用wdumps工具生成的Wikidata物理学领域测试RDF转储数据,包含4个文件,无实体、陈述及三元组数据,主要用于测试数据转储流程及文件结构验证。
文件详解
- 文件名称:
info.json
- 文件格式:JSON
- 字段映射介绍:包含转储基本信息,键值包括id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount
- 文件名称:
wdump-155.nt.gz
- 文件格式:GZ(压缩文件)
- 字段映射介绍:压缩格式的N-Triples文件,具体内容未包含实际数据
- 文件名称:
preview.nt
- 文件格式:NT
- 字段映射介绍:N-Triples格式预览文件,无实际三元组数据
- 文件名称:
wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:转储工具配置文件,键值包括statements、labels、version、sitelinks、meta、aliases、descriptions、entities
适用场景
- 数据转储工具测试: 验证wdumps工具生成Wikidata RDF转储文件的流程及格式正确性
- 知识图谱文件结构分析: 研究Wikidata转储文件的JSON配置结构与N-Triples数据格式规范
- 数据压缩与存储测试: 测试RDF数据压缩文件的生成及解压流程
- 测试环境数据支撑: 为Wikidata相关应用开发提供无实际数据的测试用转储文件