数据集概述
本数据集是通过wdumps工具生成的Wikidata国家数据RDF转储文件,包含实体、陈述和三元组等结构化数据。数据用于存储和共享Wikidata中与国家相关的信息,便于用户进行数据查询、分析和应用开发。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息和统计数据。
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含statements、version、sitelinks、entities、aliases、meta、languages、samplingPercent、descriptions、labels等字段,定义转储的规范和配置信息。
- wdump-1786.nt.gz
- 文件格式:GZ压缩的NT文件
- 内容介绍:存储RDF三元组数据的压缩文件,包含Wikidata国家相关的实体和属性信息。
- preview.nt
- 文件格式:NT
- 内容介绍:RDF三元组数据的预览文件,提供数据的示例内容。
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- 数据查询与分析:用于查询Wikidata中与国家相关的实体、属性和关系信息。
- 知识图谱构建:支持基于Wikidata国家数据构建知识图谱,应用于语义搜索、智能问答等领域。
- 数据集成与共享:作为标准化的RDF数据格式,便于与其他数据集进行集成和共享。
- 应用开发:为开发与国家相关的应用程序提供结构化数据支持,如地理信息系统、数据分析工具等。