数据集概述
本数据集是基于Wikidata生成的RDF dump,为Alex的测试概念验证产物,包含与Spotify、MusicBrainz、Tidal三个音乐平台相关的数据融合内容。数据集由wdumper工具生成,包含4个文件,实体数、陈述数及三元组数均为0,可用于音乐数据融合的技术验证场景。
文件详解
- 配置与元数据文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等配置字段
- 预览数据文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:音乐平台融合数据的预览文件,具体内容待验证
- 压缩数据文件
- 文件名称:wdump-2837.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩格式的RDF数据文件,包含音乐平台融合的三元组数据
适用场景
- 音乐数据融合技术验证: 用于测试Wikidata与Spotify、MusicBrainz、Tidal等音乐平台数据的融合方法与流程
- 多源音乐数据整合研究: 分析不同音乐平台数据的结构差异与融合可行性
- 知识图谱构建实验: 验证基于Wikidata构建音乐领域知识图谱的技术路径
- 数据处理工具测试: 用于wdumper等数据处理工具的功能验证与性能测试