Wikidata_Dump_RDF格式测试数据

数据集概述

本数据集是使用wdumper工具生成的Wikidata测试RDF转储数据,包含4个文件,涵盖实体、语句、三元组等基础数据统计信息及配置规范,适用于Wikidata数据处理相关的测试场景。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段
  • 文件名称:wdump-2624.nt.gz
  • 文件格式:GZ压缩包
  • 字段映射介绍:压缩的N-Triples格式Wikidata测试数据
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta字段
  • 文件名称:preview.nt
  • 文件格式:N-Triples
  • 字段映射介绍:Wikidata测试数据预览文件

适用场景

  • Wikidata数据处理工具测试: 用于验证Wikidata数据转储工具的功能及兼容性
  • RDF数据格式解析测试: 测试N-Triples等RDF格式数据的解析与处理能力
  • 数据统计工具验证: 验证数据统计工具对Wikidata实体、语句、三元组数量的统计准确性
  • 数据转储配置规范研究: 分析Wikidata数据转储的配置规范及参数设置
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.21 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。