数据集概述
本数据集是由wdumps工具生成的Wikidata部分RDF数据Dump,包含实体、陈述和三元组信息,总计四个文件。数据用于知识图谱相关的数据存储与处理场景,可提供结构化的知识数据支持。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta字段
- 文件名称:preview.nt
- 文件格式:NT
- 文件名称:wdump-1045.nt.gz
- 文件格式:GZ
适用场景
- 知识图谱构建: 用于构建和扩展知识图谱,提供结构化的实体和关系数据
- 语义网研究: 支持语义网相关的理论研究和技术验证
- 数据挖掘分析: 为数据挖掘任务提供多样化的知识数据来源
- 数据存储与处理技术测试: 用于测试知识图谱数据的存储、查询和处理技术性能