数据集概述
本数据集是通过wdumps工具生成的Wikidata企业测试RDF转储数据,包含4个文件,三元组数量为38,实体数和陈述数均为0,主要用于测试Wikidata数据转储流程与文件结构。
文件详解
- 元信息文件:info.json,JSON格式,包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段
- 配置文件:wdumper-spec.json,JSON格式,包含labels、descriptions、version、entities、statements、languages、meta、aliases、sitelinks字段
- 压缩数据文件:wdump-196.nt.gz,GZ压缩格式,为RDF三元组数据文件
- 预览数据文件:preview.nt,NT格式,为RDF三元组预览文件
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- Wikidata转储工具测试:验证wdumps工具生成企业测试数据的正确性与完整性
- RDF数据格式研究:分析Wikidata RDF转储文件的结构与字段规范
- 语义网络数据处理测试:作为测试数据用于语义网络相关工具的开发与调试
- 数据转储流程验证:验证Wikidata企业数据转储的流程、文件命名规则与目录结构设计