数据集 - 海数据

交响音乐录音旋律提取数据集ORCHSET

2025年12月19日 30 26 14

数据集概述该数据集是用于旋律提取算法开发与评估的专业数据集，包含64段交响音乐音频片段及其对应的旋律标注。旋律定义为听众在复调音乐中会哼唱或吹奏的单音高序列，为相关算法研究提供标准化测试数据。文件详解文件名称: Orchset_dataset_0.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...

ZIP

Seeing_Sound_Dataset_Based_合成音景与音频标注完整数据

2025年12月18日 30 191 177

数据集概述本数据集包含合成音景及众包音频标注数据，支撑研究音景复杂度与声音可视化对声音事件标注质量及速度的影响。数据涵盖不同复杂度维度（最大复调、基尼复调）的合成音景及对应标注结果。文件详解文件名称: seeing-sound-dataset-v1.0.1.zip 文件格式: ZIP压缩包内容说明:...

ZIP

TimeSide_API音频处理网络服务演示文档

2025年12月7日 30 10 1

数据集概述本数据集为一份演示文档，介绍如何使用TimeSide REST API作为远程服务处理音频描述符，以将分析结果嵌入网页应用。文档还展示了新版TimeSide播放器作为使用JavaScript SDK开发可视化与协作标注应用的示例。文件详解文件名称：WAC_2022_paper_47 (1).pdf 文件格式：PDF...

ZIP

Saraga_Audiovisual_Mini_Based_阿南达纳塔那普拉卡沙姆表演多模态数据完整样本

2025年12月15日 30 62 49

数据集概述该数据集是Saraga Audiovisual数据集的子集样本，结构与原始数据集一致。包含音频、姿态估计、元数据及视频四类压缩文件，仅涵盖Adithi Prahlad表演的《Ananda Natana Prakasham》单一曲目内容。文件详解 saraga audio.zip：压缩文件，包含所有多轨音频文件及其对应的混合文件...

ZIP

Bach10乐谱引导的音源分离数据集ISMIR2017

2025年12月12日 30 64 51

数据集概述该数据集是ISMIR2017会议论文的配套数据，基于Bach10数据集（含10首巴赫众赞歌）构建，包含论文中提出的卷积神经网络及乐谱引导NMF方法的音源分离结果，涵盖SDR、SIR、SAR指标数据和音频文件，以及训练好的CNN模型。文件详解文件名称: Bach10scoreinformed.zip 文件格式: ZIP（压缩包）...

ZIP

BASS_dB_Based_多轨音乐录音数据集_音乐源分离测试完整数据

2025年12月10日 30 186 116

数据集概述该数据集包含多轨音乐录音文件，用于评估音乐源分离算法。部分数据曾作为第一届立体声音频源分离评估活动的评估材料，为相关算法的性能测试提供支持。文件详解该数据集由21个文件组成，具体说明如下： - 许可文件: - LICENSE.xml: XML格式文件，包含数据集的内容和许可信息说明。 - 音频压缩文件: -...

ZIP

有声书数据音频片段掩蔽时间数据集

2025年11月12日 30 138 94

有声书数据音频片段掩蔽时间数据集_Audiobook_Data_Audio_Snippet_Masking_Time 数据来源：互联网公开数据标签：有声书, 音频处理, 语音识别, 时间序列分析, 数据掩蔽, 机器学习, 信号处理, 数据标注数据概述：该数据集包含有声书音频数据，记录了音频片段的掩蔽处理信息。主要特征如下：...

ZIP

音乐生成模型参数优化结果数据集

2025年10月29日 30 25 7

音乐生成模型参数优化结果数据集_Music_Generation_Model_Parameter_Optimization_Results 数据来源：互联网公开数据标签：音乐生成, 参数优化, 机器学习, 音乐分析, 音频处理, 数据分析, 算法评估, CSV数据数据概述：...

ZIP

特威语语音识别数据集

2025年10月24日 30 120 6

特威语语音识别数据集_Twi_Speech_Recognition_Dataset 数据来源：互联网公开数据标签：语音识别, 语音数据, 特威语, 声学模型, 语言学, 语音标注, 机器学习, 音频处理数据概述：该数据集包含来自公开来源的特威语语音数据，旨在用于特威语语音识别系统的开发与研究。主要特征如下：...

ZIP

YouTube视频语音活动检测数据集

2025年9月26日 30 149 13

YouTube视频语音活动检测数据集_YouTube_Video_Voice_Activity_Detection_Dataset 数据来源：互联网公开数据标签：语音识别, 语音活动检测, VAD, 音频分析, YouTube, 时间戳, 机器学习, 音频处理数据概述：...

ZIP

环境声音识别数据集

2025年9月25日 30 41 7

环境声音识别数据集_Environmental_Sound_Classification_Dataset 数据来源：互联网公开数据标签：音频分类, 声音识别, 环境声音, 机器学习, 深度学习, 音频处理, 数据集, ESC-50 数据概述：...

ZIP

鸟类声音识别多标签分类数据集

2025年9月24日 30 133 23

鸟类声音识别多标签分类数据集_Bird_Sound_Recognition_Multi_label_Classification_Dataset 数据来源：互联网公开数据标签：鸟类, 声音识别, 多标签分类, 深度学习, 音频处理, 机器学习, 生物多样性, 数据集数据概述：...

ZIP

俄语语音情感分析数据集

2025年9月8日 30 149 48

俄语语音情感分析数据集_Russian_Speech_Emotion_Analysis_Dataset 数据来源：互联网公开数据标签：语音识别, 情感分析, 俄语, 文本分析, 深度学习, CNN-LSTM模型, 语料库, 音频处理数据概述：该数据集包含来自公共广播和演讲的俄语语音数据，记录了语音片段及其对应的情感倾向。主要特征如下：...

ZIP

语音活动检测音频数据分析数据集

2025年9月2日 30 58 21

语音活动检测音频数据分析数据集_Voice_Activity_Detection_Audio_Analysis_Dataset 数据来源：互联网公开数据标签：语音识别, 语音活动检测, VAD, 音频分析, 声音事件检测, 机器学习, 深度学习, 音频处理数据概述：...

ZIP

情感语音识别评估数据集

2025年8月21日 30 131 34

情感语音识别评估数据集_Emotional_Speech_Recognition_Evaluation_Dataset 数据来源：互联网公开数据标签：语音识别, 情感分析, 语音情感, 情感识别, 声音信号, 听觉评估, 机器学习, 音频处理数据概述：...

ZIP

环境声音分类音频数据集

2025年8月21日 30 165 14

环境声音分类音频数据集_Environmental_Sound_Classification_Audio_Dataset 数据来源：互联网公开数据标签：音频分类, 声音识别, 机器学习, 深度学习, 环境声音, 音频处理, 数据集, ESC-50 数据概述：该数据集包含来自ESC-50数据集的环境声音，记录了多种环境声音的音频样本。主要特征如下：...

ZIP

音频分类识别数据集

2025年8月20日 30 18 11

音频分类识别数据集_Audio_Classification_Recognition_Dataset 数据来源：互联网公开数据标签：音频识别, 声音分类, 机器学习, 深度学习, 语音识别, 声音事件检测, 数据集, 音频处理数据概述：该数据集包含多种声音的音频文件，以及一个用于提交预测结果的CSV文件，主要用于音频分类任务。主要特征如下：...

ZIP

音频质量评估声音数据集

2025年8月1日 30 55 21

音频质量评估声音数据集_Audio_Quality_Assessment_Sound_Dataset 数据来源：互联网公开数据标签：音频分析, 声音分类, 语音识别, 质量评估, 机器学习, 数据标注, 音频处理, 声音信号数据概述：该数据集包含音频文件及其对应的质量评估标签，用于训练和测试音频质量评估模型。主要特征如下：...

ZIP

环境声音分类数据集

2025年7月24日 30 140 107

环境声音分类数据集_Environmental_Sound_Classification_Dataset 数据来源：互联网公开数据标签：声音识别, 音频分类, 环境声音, 机器学习, 深度学习, 音频处理, 数据集, ESC-50 数据概述：该数据集包含来自 ESC-50 数据库的环境声音音频文件，记录了多种环境声音的样本。主要特征如下：...

ZIP

音视频语音活动检测数据集

2025年7月21日 30 148 142

音视频语音活动检测数据集_Audio_Video_Voice_Activity_Detection 数据来源：互联网公开数据标签：语音识别, 音频分析, 语音活动检测, VAD, 时间戳, 音频处理, 机器学习, 深度学习数据概述：该数据集包含来自YouTube视频的音频数据，记录了语音活动检测（VAD）的结果。主要特征如下：...

ZIP

找到208个数据集

注册成功！