找到546个数据集

标签: 语音处理

过滤结果
  • 法国朗伯德语音数据集

    2025年12月12日   

    数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
    packageimg
  • Maxsudova_Xolisxon_Ummatovna1_Terminal_Learing_Based_终端学习语音特性研究完整数据

    2025年12月12日   

    数据集概述 本数据集包含一份关于终端学习语音特性的PDF文档,主要围绕语音相关的特性展开,未提供具体描述信息,为语音特性相关研究提供基础文档支持。 文件详解 文件名称: Maxsudоva Xоlisxоn Ummatоvna1.pdf 文件格式: PDF (.pdf) 文件内容: 文档文件,内容围绕TERMINLARNING FONETIK...
    packageimg
  • Bach10乐谱引导的音源分离数据集ISMIR2017

    2025年12月12日   

    数据集概述 该数据集是ISMIR2017会议论文的配套数据,基于Bach10数据集(含10首巴赫众赞歌)构建,包含论文中提出的卷积神经网络及乐谱引导NMF方法的音源分离结果,涵盖SDR、SIR、SAR指标数据和音频文件,以及训练好的CNN模型。 文件详解 文件名称: Bach10scoreinformed.zip 文件格式: ZIP(压缩包)...
    packageimg
  • vocadito单声部人声带基频音符和歌词标注数据集

    2025年12月11日   

    数据集概述 该数据集包含四十段单声部人声演唱的短音频片段,涵盖七种语言,由不同训练水平的歌手使用多种设备录制,标注内容由专业音乐人完成,为单声部人声的语音与音乐特征分析提供基础数据。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: vocadito.zip - 文件格式: ZIP (.zip) - 包含内容:...
    packageimg
  • 西班牙式等口音英语单词语料库

    2025年12月11日   

    数据集概述 该数据集为西班牙语口音英语单词语料库(SIAEW),包含单音节英语单词,其中一个音节(目标音节)被替换为不同程度的西班牙语口音版本,共5个等间隔的口音等级,由母语者判定。 文件详解 文件名称:SIAEW.pdf,文件格式:PDF,内容为SIAEW语料库的详细描述文档...
    packageimg
  • 耳机音频空间化脉冲响应数据集

    2025年12月11日   

    数据集概述 该数据集包含用于耳机空间音频系统双耳合成的脉冲响应数据,包括双耳房间脉冲响应(BRIRs)、耳机补偿滤波器(HpCFs)及Equalizer APO配置文件,可通过卷积音频流实现耳机空间环绕声效果。 文件详解 文件名称: ASH_IR_Dataset_v8.0.0.zip 文件格式: ZIP压缩包 压缩包内容:...
    packageimg
  • 口罩对声音辐射影响的方向性测量数据集

    2025年12月11日   

    数据集概述 本数据集包含使用HEAD acoustics HMS II.3头口模拟器测量的不同类型口罩对声音辐射方向性影响的SOFA格式数据。涵盖无口罩参考组及六种不同类型口罩(含两次重复测量),基于“GeneralFIR”约定,为研究口罩对声音传播特性的影响提供基础数据。 文件详解...
    packageimg
  • DISPLACE2024_Track3_Based_多语言对话ASR评估标签完整数据

    2025年12月11日   

    数据集概述 该数据集为DISPLACE2024挑战赛的官方数据,包含多语言多说话人自然对话内容,涵盖代码混合/切换、自然重叠、混响及噪声等多样化特征。数据用于挑战赛的开发与评估,未提供训练数据,仅包含开发和评估用的自然对话数据集,支持参与者进行模型适配。 文件详解 文件名称:Track3_ASR_eval_segment_labels.zip...
    packageimg
  • Zenodo_Annotated_VocalSet_Based_歌唱语音多维度标注完整数据集

    2025年12月11日   

    数据集概述 该数据集是对VocalSet数据集的标注补充,包含歌唱语音的基频轮廓、音符起止点、音高转换等关键标注信息,旨在提升原数据集的研究价值,为歌唱语音相关研究提供支持。 文件详解 文件名称:Annotated VocalSet.zip 文件格式:ZIP压缩包...
    packageimg
  • 柏林情感语音数据库2_0

    2025年12月10日   

    数据集概述 该数据集是柏林情感语音数据库2.0版本,包含十位演员(五位女性、五位男性)模拟七种情感录制的约八百句德语日常语句,同时记录了电声门图数据。数据按四位说话人划分为测试集、六位划分为训练集,音频为16kHz WAV格式,元信息采用audformat格式存储,还补充了模糊样本。 文件详解 文件名称: emodb_2.0.zip 文件格式:...
    packageimg
  • 京剧打击乐器数据集2013

    2025年12月10日   

    数据集概述 本数据集收录了京剧四类打击乐器(板鼓、铙钹、大锣、小锣)的单音音频样本,包含不同乐器实例及演奏技法的录音,为京剧打击乐声音特征分析与模型训练提供基础数据。 文件详解 文件名称: beijing_opera_percussion_instrument_1.0.zip 文件格式: ZIP压缩包 压缩包内容说明:...
    packageimg
  • 英语音素范围_发音方式与发音部位探索数据集

    2025年12月10日   

    数据集概述 本数据集聚焦英语语言中的音素,围绕发音方式与发音部位展开探索,通过单篇PDF文档呈现相关研究内容,为英语语音学领域的音素特征分析提供基础资料。 文件详解 文件名称:GaniyevaDildoraAzizovna.pdf 文件格式:PDF(.pdf) 文件内容:围绕英语音素的发音方式与发音部位主题展开的文档,具体内容需查阅PDF原文 适用场景...
    packageimg
  • BASS_dB_Based_多轨音乐录音数据集_音乐源分离测试完整数据

    2025年12月10日   

    数据集概述 该数据集包含多轨音乐录音文件,用于评估音乐源分离算法。部分数据曾作为第一届立体声音频源分离评估活动的评估材料,为相关算法的性能测试提供支持。 文件详解 该数据集由21个文件组成,具体说明如下: - 许可文件: - LICENSE.xml: XML格式文件,包含数据集的内容和许可信息说明。 - 音频压缩文件: -...
    packageimg
  • 人类Beatboxing人声鼓点声音声学与发音探索数据集

    2025年12月10日   

    数据集概述 本数据集是《美国声学学会期刊》(JASA)在审论文的补充材料,聚焦人类Beatboxing人声鼓点声音的声学特征与发音机制,通过电磁发音仪技术开展探索,包含音视频及图像文件。 文件详解 该数据集包含54个文件,按类型分为三类: -...
    packageimg
  • 电子版世界英语变体地图集数据集2020

    2025年12月10日   

    数据集概述 该数据集是电子版世界英语变体地图集(EWAVE)的CLDF格式压缩包,包含与英语变体相关的语言资源,可能涉及语音数据(WAV格式音频),为研究全球英语变体提供标准化数据支持。 文件详解 文件名称: cldf-datasets/ewave-v3.0.zip 文件格式: ZIP压缩包 文件内容: 压缩包可能包含遵循CLDF(Cross-...
    packageimg
  • 带情绪意图的敲门声效果数据集2019

    2025年12月9日   

    数据集概述 该数据集包含2019年10月录制的带情绪意图的敲门声音频数据,涵盖愤怒、恐惧、快乐、中性、悲伤五种情绪类别,每种情绪对应特定情境,经筛选后最终保留500个音频文件,为研究声音与情绪关联提供支持。 文件详解 文件名称:Knocking Sound Effects With Emotional Intentions.zip...
    packageimg
  • 可解释语音情感识别中基于情感类别和性别的信息性语音特征附录表

    2025年12月9日   

    数据集概述 本数据集为同名论文的附录表,涵盖基于SHAP值获取的特征信息性内容,包含情感与中性对比、性别间的统计及t检验结果,以及各模型最具信息性的前5个特征表,为语音情感识别研究提供支撑。 文件详解 文件名称:Appendix-Informative Speech Features based on Emotion Classes and...
    packageimg
  • 旁遮普方言语音数据集

    2025年12月9日   

    数据集概述 本数据集包含旁遮普方言的语音录音数据,同时提供相关的模型代码文件,为旁遮普方言语音研究提供基础数据支持。 文件详解 文件名称: FemaleMale.html 文件格式: HTML (.html) 内容说明: 包含与旁遮普方言语音模型相关的代码 文件名称: Dataset.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
    packageimg
  • 德国奥尔登堡酒吧环境视听模型数据集

    2025年12月9日   

    数据集概述 本数据集包含德国奥尔登堡一家酒吧的视听模型,用于高精度声学渲染(扬声器阵列、耳机)和虚拟现实视觉呈现。内容涵盖酒吧空间几何模型(声学模拟用)、虚拟现实视觉模型,以及声学场景定义(含双耳、四面体和全向麦克风测量的声学脉冲响应),支持听力学与听觉研究。 文件详解 文件名称: Pub Environment Description...
    packageimg
  • Duhumbi语音学_近音韵数据集

    2025年12月8日   

    数据集概述 本数据集围绕Duhumbi语言的近音韵展开,论证了将/oj ~ uj, ej ~ aj, aw ~ ow/分析为近音韵而非独立双元音音位的观点,包含用于示例说明的音频文件压缩包及相关文档。 文件详解 压缩包文件(共5个,.zip格式): Bodish Tshangla loans.zip:可能包含与Bodish...
    packageimg