找到71个数据集

标签: 音频

过滤结果
  • 生成式歌声分离模型客观评估指标数据集

    2025年12月14日 30 59 43

    数据集概述 本数据集为WASPAA 2025相关论文的配套数据,包含用于计算生成式歌声分离模型客观评估指标的音频数据、DCR测试用响度归一化刺激音频、含DMOS分数与指标的CSV文件及SRCC计算演示Python脚本,提供完整评估资源。 文件详解 文件名称: gensvs_eval_data.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg
  • 卡纳提克瓦纳姆数据集1_1

    2025年12月10日 30 75 41

    数据集概述 该数据集为卡纳提克音乐拉加斯语调分析研究而创建,包含28段无伴奏(仅含持续低音)的瓦纳姆独奏录音、塔拉节奏循环标注及机器可读格式的乐谱。1.1版本新增了乐谱与时间对齐的结构信息,适用于旋律分析与音频-乐谱对齐研究。 文件详解 文件名称: carnatic_varnam_1.1.zip 文件格式: ZIP压缩包 内部包含内容分类:...
    packageimg
  • ARASAAC彩色象形图数据集_第7部分_共16部分

    2025年12月10日 30 134 94

    数据集概述 该数据集为ARASAAC彩色象形图系列的第7部分,包含一千个由Sergio Palao创作的黑白象形图。图片以PNG格式为主,覆盖生物学、统计学、医学、图像视觉、音频等领域的语义关键词,可作为视觉符号资源使用。 文件详解 核心文件内容: 包含一千个文件,其中九百九十九个为PNG格式的象形图文件,一个为无扩展名文件...
    packageimg
  • ARASAAC彩色象形图第九部分_共十六部分

    2025年12月8日 30 141 91

    数据集概述 该数据集是ARASAAC彩色象形图的第九部分(共十六部分),包含由Sergio Palao为ARASAAC创建的一千张黑白象形图,覆盖生物学、GIS空间、医学、图像视觉、音频等多领域语义关键词,以PNG格式存储。 文件详解 核心文件集合: 共包含1000个.png格式文件...
    packageimg
  • ARASAAC黑白象形图数据集第七部分

    2025年12月8日 30 199 112

    数据集概述 该数据集为ARASAAC黑白象形图系列的第七部分,包含一千张由Sergio Palao创建的黑白PNG格式象形图,覆盖生物学、医学、图像视觉等多领域语义主题,无目录层级与数据划分。 文件详解 核心文件: 共一千个PNG格式文件,均为黑白象形图,无目录结构 文件示例:...
    packageimg
  • ARASAAC彩色象形图第八部分_共十六部分

    2025年12月5日 30 132 69

    数据集概述 本数据集为ARASAAC彩色象形图系列的第八部分,包含一千张由Sergio Palao创作的黑白象形图,覆盖生物学、医学、图像视觉、自然语言处理、音频等领域的语义主题,可用于多场景的视觉符号表达。 文件详解 核心文件组: 1000个.png格式文件:所有文件均为PNG图像格式,无目录层级结构...
    packageimg
  • 白南准_20世纪安魂曲三维扫描数据集2014

    2025年12月4日 30 66 14

    数据集概述 该数据集是艺术家白南准作品《20世纪安魂曲》的三维扫描数据,作品以1936年克莱斯勒气流型汽车为载体,结合影像、音频等媒介创作于1997年,三维扫描完成于2014年。 文件详解 文件名称: 4bb640d2b982459a8ab53cc6b8fe6a7b.glb,文件格式: GLB,为作品的三维模型文件 文件名称:...
    packageimg
  • ARASAAC彩色象形图第十部分

    2025年12月4日 30 32 7

    数据集概述 该数据集包含一千张由Sergio Palao为ARASAAC创建的黑白象形图,涵盖生物、实验、医疗、图像视觉、音频等多个领域的主题,无目录结构,所有文件均为PNG格式。 文件详解 文件类型:PNG格式(.png),共1000个文件,占比百分之百...
    packageimg
  • 农业作物病害音频识别数据集

    2025年10月28日 30 143 76

    农业作物病害音频识别数据集_Agricultural_Crop_Disease_Audio_Recognition_Dataset 数据来源:互联网公开数据 标签:农业, 病害识别, 音频, 机器学习, 作物, 生物声学, 疾病诊断, 语音识别 数据概述: 该数据集包含音频文件和对应的标签,用于识别农业作物病害。主要特征如下:...
    packageimg
  • 农业作物病害音频识别数据集

    2025年10月25日 30 92 86

    农业作物病害音频识别数据集_Agricultural_Crop_Disease_Audio_Recognition_Dataset 数据来源:互联网公开数据 标签:农业, 病害识别, 音频, 机器学习, 作物, 生物声学, 疾病诊断, 语音识别 数据概述: 该数据集包含音频文件和对应的标签,用于识别农业作物病害。主要特征如下:...
    packageimg
  • 音乐旋律音高与音频数据集

    2025年10月24日 30 205 42

    音乐旋律音高与音频数据集_Music_Melody_Pitch_and_Audio_Dataset 数据来源:互联网公开数据 标签:音乐, 音频, 旋律, 音高, 音符, MIDI, 音频分析, 数据处理 数据概述: 该数据集包含音乐旋律的音高信息及对应的音频文件,旨在为音乐分析、生成和处理提供数据支持。主要特征如下:...
    packageimg
  • 古兰经诵读音频数据集

    2025年9月11日 30 121 29

    古兰经诵读音频数据集_Quran_Recitation_Audio_Dataset 数据来源:互联网公开数据 标签:古兰经, 音频, 诵读, 阿拉伯语, 宗教, 语音, 机器学习, 声音 数据概述: 该数据集包含来自互联网的古兰经诵读音频文件,记录了不同诵读者对古兰经经文的诵读内容。主要特征如下: 时间跨度:数据未明确时间信息,可视为音频资料的集合。...
    packageimg
  • 音乐音频特征及元数据分析数据集

    2025年9月9日 30 4 2

    音乐音频特征及元数据分析数据集_Music_Audio_Features_and_Metadata_Analysis_Dataset 数据来源:互联网公开数据 标签:音乐,音频,特征提取,元数据,机器学习,音乐流派,音频分析,深度学习 数据概述: 该数据集包含来自Free Music Archive (FMA)...
    packageimg
  • 宗教音频古兰经诵读数据集

    2025年7月10日 30 147 97

    宗教音频古兰经诵读数据集_Religious_Audio_Quran_Recitation_Dataset 数据来源:互联网公开数据 标签:古兰经, 音频, 诵读, 宗教, 声音, 穆罕默德, 阿拉伯语, 语音 数据概述: 该数据集包含来自互联网的古兰经诵读音频文件,记录了不同诵读者的古兰经经文朗诵内容。主要特征如下:...
    packageimg
  • 鸟类音频数据集

    2025年6月4日 30 187 170

    鸟类音频数据集 数据来源:互联网公开数据 标签:鸟类,音频,生物多样性,生态保护,物种识别,声音分析,自然声音 数据概述: 本数据集包含了多种鸟类的音频资源及相关信息,每条记录包含鸟类的学名、英名、分布地点等基本信息,以及用于下载鸟类音频的链接。数据集旨在为研究鸟类声音特征、分布区域及物种多样性提供基础支持。 数据用途概述:...
    packageimg
  • 印度古典音乐塔布拉鼓塔拉节奏模式识别数据集-pranav6670

    2025年6月4日 30 144 137

    印度古典音乐塔布拉鼓塔拉节奏模式识别数据集-pranav6670 数据来源:互联网公开数据 标签:塔布拉鼓,印度古典音乐,节奏模式,音频,音乐信息检索,塔拉,分类 数据概述:...
    packageimg
  • ProtoSound音频分类模型训练数据集-多类别音频-时间序列-动态-akkaneror

    2025年6月4日 30 120 109

    ProtoSound音频分类模型训练数据集-多类别音频-时间序列-动态-akkaneror 数据来源:互联网公开数据 标签:音频,分类,机器学习,时间序列,ProtoSound,MAML,元学习,声音,数据集 数据概述:...
    packageimg
  • 印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar

    2025年6月1日 30 15 3

    印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar 数据来源:互联网公开数据 标签:印地语,语音识别,性别分类,语音数据,机器学习,音频,语音,男声,女声,Common Voice,开源数据集 数据概述: 本数据集旨在用于印地语语音的性别分类研究,包含来自Common...
    packageimg
  • 乌尔都语音频片段及其转录数据集

    2025年6月1日 30 201 120

    乌尔都语音频片段及其转录数据集 数据来源:互联网公开数据 标签:乌尔都语,音频,语音识别,自然语言处理,语音转文本,语音分析 数据概述: 本数据集包含乌尔都语的音频片段及其对应的转录文本。音频片段平均时长为10秒,数据集记录了部分片段的转录内容,其中部分片段的转录结果为“无法理解音频”,可能表明音频文件存在问题或仅包含音乐。 数据用途概述:...
    packageimg
  • 百万歌曲数据集-音乐特征分析与研究-2010年

    2025年4月15日 60 162 62

    百万歌曲数据集-音乐特征分析与研究-2010年 数据来源:互联网公开数据 标签:音乐,歌曲,音频,特征,分析,艺术家,节奏,旋律,百万歌曲数据集,ISMIR 数据概述: 本数据集源自“百万歌曲数据集”(Million Song Dataset),该数据集由The Echo...
    packageimg