数据集概述
本数据集是通过wdumper工具生成的Wikidata人物视图(PersonsView)的RDF格式转储数据,包含人物实体相关的结构化语义数据。数据集包含4个文件,涵盖配置信息、转储数据和预览文件,可用于Wikidata人物实体的语义分析与知识图谱构建。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储工具版本、生成日期及数据统计信息
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等字段,定义转储配置参数
- 文件名称:wdump-2511.nt.gz
- 文件格式:GZ压缩的NT(N-Triples)
- 字段映射介绍:Wikidata人物实体的RDF三元组数据压缩文件,存储语义网格式的实体关系
- 文件名称:preview.nt
- 文件格式:NT(N-Triples)
- 字段映射介绍:人物实体RDF数据的预览文件,包含未压缩的三元组示例
数据来源
Wikidata(通过wdumper工具生成)
适用场景
- 知识图谱构建:基于RDF三元组数据构建人物实体知识图谱,分析人物关系网络
- 语义网研究:用于Wikidata语义数据模型的结构分析与应用开发
- 数据转储工具验证:验证wdumper工具对特定视图(PersonsView)的转储效果与数据完整性
- 人物实体数据分析:提取Wikidata人物实体的属性、标签及描述信息,支持人物相关研究