Wikidata_Dump_Essai测试数据集

数据集概述

本数据集是使用wdumps工具生成的Wikidata RDF导出测试数据,包含4个文件,无实体、陈述及三元组记录。文件涵盖配置信息、预览数据和压缩数据,可用于验证Wikidata数据导出流程及文件结构。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF预览数据文件,无实体、陈述及三元组记录
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements字段
  • 文件名称:wdump-2059.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的RDF数据文件,无实体、陈述及三元组记录

适用场景

  • Wikidata导出工具测试: 验证wdumps工具生成RDF导出文件的流程及格式正确性
  • 语义数据文件结构分析: 研究Wikidata RDF导出文件的配置规范和数据组织方式
  • 数据压缩格式验证: 测试RDF数据压缩文件的生成及解压流程
  • 数据导出配置优化: 基于导出配置文件调整Wikidata数据导出参数
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。