Wikidata_RDF_Dump_人类性别信息语义网数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF转储,包含所有带有性别信息的人类实体相关数据。数据以多种格式存储,涵盖元数据、规范文件、预览数据及压缩数据文件,可用于语义网分析、数据挖掘等场景。

文件详解

  • 元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta等键的对象结构
  • 预览数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF预览数据文件,采用N-Triples格式存储语义网三元组
  • 压缩数据文件
  • 文件名称:wdump-1059.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的RDF数据文件,包含编号为1059的N-Triples格式数据

数据来源

Wikidata(通过wdumps工具生成)

适用场景

  • 语义网研究:用于分析Wikidata中人类实体性别信息的语义网结构和三元组关系
  • 数据挖掘分析:挖掘人类实体性别信息的分布特征和关联模式
  • 知识图谱构建:支持基于Wikidata数据的人类性别信息知识图谱构建
  • 数据集成应用:作为标准化RDF格式数据,用于跨系统的数据集成与共享
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。