阿拉伯_安达卢西亚音乐歌词数据集

数据集概述

该数据集包含CompMusic项目中阿拉伯-安达卢西亚音乐曲库的歌词,涵盖"Isbahan"、"Maya"等九种 nawbas 类型。歌词以原始阿拉伯文和ALA-LC标准转写的罗马化版本呈现,存储为TSV、JSON格式文件,并关联音频文件及元数据。

文件详解

  • 压缩文件:
  • Sanas_v2.zip: ZIP格式压缩包,包含数据集所有内容
  • 内部文件结构:
  • 原始歌词文件: 存储于'original'文件夹,按MusicBrainz录音ID(MBID)命名,格式为TSV、JSON
  • 转写歌词文件: 存储于'transliterated'文件夹,按MBID命名,格式为TSV、JSON,采用ALA-LC标准
  • 元数据文件: metadata.csv,包含Internet Archive音频文件URL等信息

数据来源

CompMusic项目

适用场景

  • 音乐学研究: 分析阿拉伯-安达卢西亚音乐的歌词文本特征与文化内涵
  • 语言学研究: 对比阿拉伯语原始文本与罗马化转写的语言转换规律
  • 数字人文研究: 结合音频与歌词数据开展跨模态音乐文化分析
  • 文化遗产保护: 支持阿拉伯-安达卢西亚传统音乐的数字化存档与传播研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.94 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。