Wikidata_Based_RDF转储数据_2024

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含实体、陈述和三元组信息。数据以多种格式存储,包括JSON、NT和压缩文件,提供了Wikidata数据的结构化表示,适用于语义网络分析和数据挖掘。

文件详解

  • 元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息和统计数据。
  • 转储规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、descriptions、entities、sitelinks、labels、version、meta、aliases等字段,定义转储的具体规范和结构。
  • 压缩数据文件
  • 文件名称:wdump-969.nt.gz
  • 文件格式:GZIP压缩的NT文件
  • 字段映射介绍:包含Wikidata的RDF三元组数据,采用N-Triples格式存储。
  • 预览数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:提供Wikidata数据的预览,包含部分RDF三元组信息。

适用场景

  • 语义网络分析:研究Wikidata实体之间的关系和知识图谱结构。
  • 数据挖掘:提取Wikidata中的实体、属性和陈述信息,用于知识发现。
  • 知识图谱构建:基于RDF转储数据构建或扩展知识图谱。
  • 数据集成:将Wikidata数据与其他数据集集成,支持跨领域分析。
  • 工具测试:用于测试和验证处理RDF数据的工具和应用程序。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。