Wikidata_Dump_测试转储数据

数据集概述

本数据集是使用wdumps工具生成的Wikidata测试RDF转储数据,包含4个文件,实体数、陈述数、三元组数均为0,用于知识图谱数据处理相关的测试场景。

文件详解

  • 配置与元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、descriptions、entities、languages、sitelinks、labels、version、meta、aliases等配置字段
  • 数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF三元组格式的预览数据文件
  • 压缩数据文件
  • 文件名称:wdump-921.nt.gz
  • 文件格式:GZ压缩包
  • 字段映射介绍:压缩的RDF三元组格式数据文件

适用场景

  • 知识图谱工具测试:用于测试Wikidata转储数据处理工具的兼容性与功能完整性
  • 数据格式验证:验证RDF、JSON等知识图谱数据格式的解析与生成逻辑
  • 数据处理流程测试:模拟Wikidata转储数据的处理流程,如解压、解析、转换等
  • 元数据管理测试:测试知识图谱数据元数据的提取、存储与查询功能
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.64 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。