数据集 - 海数据

交响音乐录音旋律提取数据集ORCHSET

2025年12月19日 30 117 41

数据集概述该数据集是用于旋律提取算法开发与评估的专业数据集，包含64段交响音乐音频片段及其对应的旋律标注。旋律定义为听众在复调音乐中会哼唱或吹奏的单音高序列，为相关算法研究提供标准化测试数据。文件详解文件名称: Orchset_dataset_0.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...

ZIP

生成式歌声分离模型客观评估指标数据集

2025年12月14日 30 206 87

数据集概述本数据集为WASPAA 2025相关论文的配套数据，包含用于计算生成式歌声分离模型客观评估指标的音频数据、DCR测试用响度归一化刺激音频、含DMOS分数与指标的CSV文件及SRCC计算演示Python脚本，提供完整评估资源。文件详解文件名称: gensvs_eval_data.zip 文件格式: ZIP压缩包包含内容:...

ZIP

卡纳提克瓦纳姆数据集1_1

2025年12月10日 30 175 96

数据集概述该数据集为卡纳提克音乐拉加斯语调分析研究而创建，包含28段无伴奏（仅含持续低音）的瓦纳姆独奏录音、塔拉节奏循环标注及机器可读格式的乐谱。1.1版本新增了乐谱与时间对齐的结构信息，适用于旋律分析与音频-乐谱对齐研究。文件详解文件名称: carnatic_varnam_1.1.zip 文件格式: ZIP压缩包内部包含内容分类：...

ZIP

ARASAAC彩色象形图数据集_第7部分_共16部分

2025年12月10日 30 138 82

数据集概述该数据集为ARASAAC彩色象形图系列的第7部分，包含一千个由Sergio Palao创作的黑白象形图。图片以PNG格式为主，覆盖生物学、统计学、医学、图像视觉、音频等领域的语义关键词，可作为视觉符号资源使用。文件详解核心文件内容：包含一千个文件，其中九百九十九个为PNG格式的象形图文件，一个为无扩展名文件...

ZIP

ARASAAC彩色象形图第九部分_共十六部分

2025年12月8日 30 55 37

数据集概述该数据集是ARASAAC彩色象形图的第九部分（共十六部分），包含由Sergio Palao为ARASAAC创建的一千张黑白象形图，覆盖生物学、GIS空间、医学、图像视觉、音频等多领域语义关键词，以PNG格式存储。文件详解核心文件集合：共包含1000个.png格式文件...

ZIP

ARASAAC黑白象形图数据集第七部分

2025年12月8日 30 131 9

数据集概述该数据集为ARASAAC黑白象形图系列的第七部分，包含一千张由Sergio Palao创建的黑白PNG格式象形图，覆盖生物学、医学、图像视觉等多领域语义主题，无目录层级与数据划分。文件详解核心文件: 共一千个PNG格式文件，均为黑白象形图，无目录结构文件示例:...

ZIP

ARASAAC彩色象形图第八部分_共十六部分

2025年12月5日 30 203 161

数据集概述本数据集为ARASAAC彩色象形图系列的第八部分，包含一千张由Sergio Palao创作的黑白象形图，覆盖生物学、医学、图像视觉、自然语言处理、音频等领域的语义主题，可用于多场景的视觉符号表达。文件详解核心文件组： 1000个.png格式文件：所有文件均为PNG图像格式，无目录层级结构...

ZIP

白南准_20世纪安魂曲三维扫描数据集2014

2025年12月4日 30 149 128

数据集概述该数据集是艺术家白南准作品《20世纪安魂曲》的三维扫描数据，作品以1936年克莱斯勒气流型汽车为载体，结合影像、音频等媒介创作于1997年，三维扫描完成于2014年。文件详解文件名称: 4bb640d2b982459a8ab53cc6b8fe6a7b.glb，文件格式: GLB，为作品的三维模型文件文件名称:...

ZIP

ARASAAC彩色象形图第十部分

2025年12月4日 30 174 20

数据集概述该数据集包含一千张由Sergio Palao为ARASAAC创建的黑白象形图，涵盖生物、实验、医疗、图像视觉、音频等多个领域的主题，无目录结构，所有文件均为PNG格式。文件详解文件类型：PNG格式（.png），共1000个文件，占比百分之百...

ZIP

农业作物病害音频识别数据集

2025年10月28日 30 138 50

农业作物病害音频识别数据集_Agricultural_Crop_Disease_Audio_Recognition_Dataset 数据来源：互联网公开数据标签：农业, 病害识别, 音频, 机器学习, 作物, 生物声学, 疾病诊断, 语音识别数据概述：该数据集包含音频文件和对应的标签，用于识别农业作物病害。主要特征如下：...

ZIP

农业作物病害音频识别数据集

2025年10月25日 30 193 58

农业作物病害音频识别数据集_Agricultural_Crop_Disease_Audio_Recognition_Dataset 数据来源：互联网公开数据标签：农业, 病害识别, 音频, 机器学习, 作物, 生物声学, 疾病诊断, 语音识别数据概述：该数据集包含音频文件和对应的标签，用于识别农业作物病害。主要特征如下：...

ZIP

音乐旋律音高与音频数据集

2025年10月24日 30 19 17

音乐旋律音高与音频数据集_Music_Melody_Pitch_and_Audio_Dataset 数据来源：互联网公开数据标签：音乐, 音频, 旋律, 音高, 音符, MIDI, 音频分析, 数据处理数据概述：该数据集包含音乐旋律的音高信息及对应的音频文件，旨在为音乐分析、生成和处理提供数据支持。主要特征如下：...

ZIP

古兰经诵读音频数据集

2025年9月11日 30 66 9

古兰经诵读音频数据集_Quran_Recitation_Audio_Dataset 数据来源：互联网公开数据标签：古兰经, 音频, 诵读, 阿拉伯语, 宗教, 语音, 机器学习, 声音数据概述：该数据集包含来自互联网的古兰经诵读音频文件，记录了不同诵读者对古兰经经文的诵读内容。主要特征如下：时间跨度：数据未明确时间信息，可视为音频资料的集合。...

ZIP

音乐音频特征及元数据分析数据集

2025年9月9日 30 101 74

音乐音频特征及元数据分析数据集_Music_Audio_Features_and_Metadata_Analysis_Dataset 数据来源：互联网公开数据标签：音乐，音频，特征提取，元数据，机器学习，音乐流派，音频分析，深度学习数据概述：该数据集包含来自Free Music Archive (FMA)...

ZIP

宗教音频古兰经诵读数据集

2025年7月10日 30 73 34

宗教音频古兰经诵读数据集_Religious_Audio_Quran_Recitation_Dataset 数据来源：互联网公开数据标签：古兰经, 音频, 诵读, 宗教, 声音, 穆罕默德, 阿拉伯语, 语音数据概述：该数据集包含来自互联网的古兰经诵读音频文件，记录了不同诵读者的古兰经经文朗诵内容。主要特征如下：...

ZIP

鸟类音频数据集

2025年6月4日 30 62 34

鸟类音频数据集数据来源：互联网公开数据标签：鸟类,音频,生物多样性,生态保护,物种识别,声音分析,自然声音数据概述：本数据集包含了多种鸟类的音频资源及相关信息，每条记录包含鸟类的学名、英名、分布地点等基本信息，以及用于下载鸟类音频的链接。数据集旨在为研究鸟类声音特征、分布区域及物种多样性提供基础支持。数据用途概述：...

ZIP

印度古典音乐塔布拉鼓塔拉节奏模式识别数据集-pranav6670

2025年6月4日 30 181 62

印度古典音乐塔布拉鼓塔拉节奏模式识别数据集-pranav6670 数据来源：互联网公开数据标签：塔布拉鼓,印度古典音乐,节奏模式,音频,音乐信息检索,塔拉,分类数据概述：...

ZIP

ProtoSound音频分类模型训练数据集-多类别音频-时间序列-动态-akkaneror

2025年6月4日 30 166 141

ProtoSound音频分类模型训练数据集-多类别音频-时间序列-动态-akkaneror 数据来源：互联网公开数据标签：音频,分类,机器学习,时间序列,ProtoSound,MAML,元学习,声音,数据集数据概述：...

ZIP

印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar

2025年6月1日 30 8 7

印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar 数据来源：互联网公开数据标签：印地语,语音识别,性别分类,语音数据,机器学习,音频,语音,男声,女声,Common Voice,开源数据集数据概述：本数据集旨在用于印地语语音的性别分类研究，包含来自Common...

ZIP

乌尔都语音频片段及其转录数据集

2025年6月1日 30 12 9

乌尔都语音频片段及其转录数据集数据来源：互联网公开数据标签：乌尔都语,音频,语音识别,自然语言处理,语音转文本,语音分析数据概述：本数据集包含乌尔都语的音频片段及其对应的转录文本。音频片段平均时长为10秒，数据集记录了部分片段的转录内容，其中部分片段的转录结果为“无法理解音频”，可能表明音频文件存在问题或仅包含音乐。数据用途概述：...

ZIP

找到72个数据集

注册成功！