Wikidata_RDF_Dump_物理测试数据集

数据集概述

本数据集是使用wdumps工具生成的Wikidata物理测试RDF转储数据,包含4个文件,实体数、陈述数和三元组数均为0,无训练/测试、数据/标签、原始/处理等数据拆分,主要用于测试场景。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息
  • wdump-155.nt.gz
  • 文件格式:GZ压缩的NT文件
  • 字段映射介绍:RDF格式的转储数据文件,采用NT格式存储
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF预览文件,采用NT格式存储
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、labels、version、sitelinks、meta、aliases、descriptions、entities等键的对象结构,记录转储规范

数据来源

Wikidata(通过wdumps工具生成)

适用场景

  • Wikidata转储工具测试:验证wdumps工具生成RDF转储的功能和流程
  • RDF数据处理测试:用于测试RDF文件解析、存储等数据处理流程
  • 数据格式兼容性测试:验证不同系统对NT格式、JSON格式的兼容性
  • 数据管理流程测试:模拟Wikidata转储数据的管理、存储和访问流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.23 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。