数据集概述
本数据集是通过wdumps工具生成的Wikidata中有人居住地点(Populated places)的RDF格式数据转储,包含4个相关文件,涵盖配置文件、规范文件、压缩数据文件和预览文件,可用于获取Wikidata中地理实体的结构化信息。
文件详解
- 配置与规范文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含statements、descriptions、entities、version、meta、sitelinks、languages、aliases、labels等配置字段
- 数据文件
- 文件名称:wdump-669.nt.gz
- 文件格式:GZ压缩文件(内含NT格式数据)
- 字段映射介绍:RDF三元组数据压缩包,包含Wikidata中有人居住地点的结构化数据
- 预览文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组预览文件,展示数据样例
适用场景
- 知识图谱构建: 用于提取和整合Wikidata中有人居住地点的结构化地理信息
- 地理信息分析: 分析全球有人居住地点的分布及属性特征
- 语义网研究: 基于RDF格式数据开展语义网相关技术研究与应用开发
- 数据挖掘: 挖掘Wikidata地理实体间的关联关系与属性规律