数据集概述
本数据集是通过wdumper工具生成的Wikidata宗教主题RDF转储数据,包含实体、声明及三元组等结构化知识数据,文件总数为4个,涵盖JSON、NT、GZ等格式,主要用于宗教相关知识图谱的构建与分析。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含数据转储的元信息,字段有id(唯一标识)、wdtkVersion(工具版本)、toolVersion(工具版本)、dumpDate(转储日期)、tripleCount(三元组数量)、entityCount(实体数量)、statementCount(声明数量)
- preview.nt
- 文件格式:NT(N-Triples)
- 字段映射介绍:宗教主题实体的RDF三元组预览数据,以三元组形式存储实体关系
- wdump-2978.nt.gz
- 文件格式:GZ压缩文件
- 字段映射介绍:压缩后的宗教主题RDF三元组数据文件,包含完整的实体及关系信息
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:转储配置文件,字段有version(版本)、entities(实体配置)、samplingPercent(采样比例)、statements(声明配置)、sitelinks(站点链接配置)、labels(标签配置)、descriptions(描述配置)、aliases(别名配置)、languages(语言配置)、meta(元信息)
数据来源
Wikidata(通过wdumper工具生成)
适用场景
- 宗教知识图谱构建:利用RDF三元组数据构建结构化的宗教知识图谱,整合实体及关系信息
- 宗教实体关系分析:通过三元组数据挖掘宗教相关实体间的关联与层级结构
- 知识图谱数据预处理:作为宗教主题知识图谱的原始数据来源,支持数据清洗与整合
- 语义网技术研究:用于研究RDF数据格式在宗教知识领域的应用与实践