数据集概述
本数据集是使用wdumps工具生成的Wikidata铁路站点信息RDF转储数据。包含4个文件,涵盖配置说明、元数据信息、预览数据及压缩数据文件,可用于铁路站点相关知识图谱的构建与分析。
文件详解
- 配置与元数据文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含labels、meta、statements、sitelinks、version、entities、aliases、descriptions等配置字段
- 数据文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:铁路站点相关的RDF三元组预览数据
- 文件名称:wdump-418.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩格式的铁路站点RDF三元组数据文件
数据来源
Wikidata
适用场景
- 知识图谱构建:用于铁路站点知识图谱的构建与扩展
- 语义网研究:作为RDF数据格式的实例,支持语义网相关技术研究
- 铁路信息分析:提取铁路站点的属性信息,支持铁路网络相关分析
- 数据转储技术研究:分析Wikidata数据转储的格式与结构,支持数据转储工具的开发与优化