找到534个数据集

标签: 语音处理

过滤结果
  • EMOSEC_Based_双语语音情感描述数据集

    2026年2月1日 30 172 23

    数据集概述 本数据集为基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,整合了语音数据与对应的情感描述内容,以单一JSON文件形式提供,未划分训练/测试集或数据/标签集。 文件详解 文件名称:merged_file.json 文件格式:JSON...
    packageimg
  • EMOSEC_Based_中英语音情感描述数据集

    2026年2月1日 30 136 72

    数据集概述 本数据集为EMOSEC Dataset,是基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,包含中文和英文的语音情感描述内容,以合并后的JSON文件形式提供,可用于语音情感分析相关研究。 文件详解 文件名称:merged_file.json 文件格式:JSON...
    packageimg
  • TRIOS_Based_乐谱对齐音乐多轨录音数据集

    2026年1月31日 0 60 16

    数据集概述 本数据集为乐谱对齐的多轨录音数据集,包含5首室内乐三重奏作品的分离音轨及对齐的MIDI乐谱,可支持乐谱引导源分离、自动音乐转录等音乐研究任务,数据集整体打包为一个压缩文件。 文件详解 文件名称:TRIOS Dataset.zip 文件格式:ZIP...
    packageimg
  • NUBUC_Based_语境控制口语故事语料库数据

    2026年1月31日 30 127 112

    数据集概述 本数据集为NyU-BU语境控制故事语料库(NUBUC),是兼顾自然性与实验可控性的口语语料库。包含8个独特故事的16段高质量录音,由男女演员各录制一遍,每故事含128句约2000词,围绕关键词构建,关键词在多语言维度匹配,语境参数(先验/局部语境强弱、句子位置早晚)被操控。 文件详解 文件名称:public.zip 文件格式:ZIP...
    packageimg
  • FeatureTTS_Based_音系特征映射数据

    2026年1月31日 30 87 52

    数据集概述 本数据集为FeatureTTS相关的音系特征映射数据,包含APRAbet与SAMPA、拼音与SAMPA-SC、SAMPA/SAMPA-SC与基于FUL的音系特征之间的映射关系,用于语音合成领域的音系特征转换与处理。 文件详解 文件名称:CMU2SAMPA_Pinyin2SAMPA_SAMPA2Features.xlsx 文件格式:XLSX...
    packageimg
  • MowIT_Based_农业机器人声音异常检测数据集

    2026年1月31日 30 123 100

    数据集概述 本数据集包含农业机器人MowIT割草工具的声音异常检测相关数据,通过两个麦克风采集单通道音频(采样率44100Hz、16位分辨率),同时记录集成的惯性测量单元(IMU)数据。数据在两种户外草地环境下采集,涵盖不同切割工具(修剪线、刀片)、配置组合及异常状态(电机压力停机等),为农业机器人声音异常检测提供实验数据。 文件详解...
    packageimg
  • ICASSP_Based_板弹簧混响建模音频样本数据

    2026年1月31日 30 173 60

    数据集概述 本数据集是ICASSP 2020论文《Modeling plate and spring reverberation using a DSP-informed deep neural network》的配套音频样本,包含干、湿两种状态的贝斯和吉他录音,涵盖板混响(VST插件生成)与弹簧混响(Accutronics...
    packageimg
  • PB2007_Based_法语声学_发音同步语音数据集

    2026年1月31日 30 31 25

    数据集概述 本数据集为PB2007法语声学-发音语音数据库,包含法语语音的声学信号与电磁发音仪(EMA)记录的发音运动数据,同步采集自法语受试者,支持语音生产机制研究与声学-发音转换模型开发。 文件详解 _seq/目录 内容:电磁发音仪(EMA)数据,采样频率100Hz...
    packageimg
  • Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据

    2026年1月30日 30 141 139

    数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
    packageimg
  • SPECS_Based_语音风格关键词采集与背景噪声数据集

    2026年1月29日 30 90 5

    数据集概述 本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。 文件详解 主文件 文件名称:SPECS.zip 文件格式:ZIP...
    packageimg
  • lexibank_Papuan_Voices巴布亚语音数据集

    2026年1月29日 30 129 6

    数据集概述 本数据集为Papuan Voices语音数据,包含一份压缩文件,主要内容涉及巴布亚地区的语音记录,属于语言类数据集,可用于语言学相关研究与分析。 文件详解 文件名称:lexibank/papuanvoices-v1.2.zip 文件格式:ZIP...
    packageimg
  • MAVC100_Based_音乐视听语音活动检测帧级标注数据集

    2026年1月29日 30 44 34

    数据集概述 本数据集为MAVC100音乐视听语料库,包含一百分钟音乐视听内容及帧级标注。标注分为音频标签与视听标签两类,前者覆盖音频流中所有语音、歌唱等事件,后者仅标记目标说话人的语音与歌唱。数据支持音乐场景下的语音活动检测研究。 文件详解 文件名称:Open_dataset_MAVC100.zip 文件格式:ZIP...
    packageimg
  • Prosodic_Based_词切分任务韵律边界线索逆相关研究数据

    2026年1月27日 30 92 53

    数据集概述 本数据集包含韵律逆相关研究中使用的刺激材料、原始数据和后处理数据,研究主题为词切分任务中的词边界韵律线索。实验采用单区间试次设计,目标词结构为l'aX和la'X,共47名参与者分5种条件参与,实验通过fastACI工具箱实现,数据集含4个文件。 文件详解 刺激材料文件: 文件名称:01-Stimuli.zip 文件格式:ZIP...
    packageimg
  • is24_Interspeech2024_欧洲议会录音多语言测试集

    2026年1月27日 30 178 68

    数据集概述 本数据集是从欧洲议会会议录音中提取的多语言测试集,用于语言识别和语音识别任务。包含15个多语言音频文件,总时长约2小时56分34秒,覆盖19种语言,经人工核对语言标签时间戳并补充官方文本转录,可支持多语言语音技术的模型测试与评估。 文件详解 文件名称:tst_is24.zip 文件格式:ZIP...
    packageimg
  • PHOIBLE_Online_Based_语音数据库数据_2014版

    2026年1月27日 30 86 3

    数据集概述 本数据集为PHOIBLE Online语音数据库2014版,由Steven Moran、Daniel McCloy和Richard Wright主编,包含全球语言的语音系统数据,是语言学领域研究语音多样性的基础资源,仅含一个压缩文件。 文件详解 文件名称:phoible-v2014.zip 文件格式:ZIP(压缩包)...
    packageimg
  • IPA_Transcription_印尼西芒加莱方言语音转录与录音数据

    2026年1月26日 30 86 33

    数据集概述 本数据集包含印度尼西亚东努沙登加拉省西芒加莱地区十个调查点的方言语音数据,采用国际音标(IPA)进行转录,同时提供对应的语音录音文件,可用于方言语音特征分析与研究,总计包含十七个文件。 文件详解 语音录音文件(MP3格式) 文件名称:包含sample of [e] sound in gloss fish.mp3、sample of [h]...
    packageimg
  • Minspeech_Source_闽南语语音识别语料库数据v1_0_0

    2026年1月26日 30 54 38

    数据集概述 本数据集为闽南语方言语音识别语料库(Minspeech v1.0.0),包含用于自动语音识别的闽南语语音数据,整体以压缩包形式存储,未划分训练/测试集、数据/标签集及原始/处理数据,无额外目录层级。 文件详解 文件名称:Minspeech-1.0.0.zip 文件格式:ZIP...
    packageimg
  • Gronings_Based_低资源语言口语术语检测特征提取方法评估数据集

    2026年1月21日 30 182 128

    数据集概述 本数据集用于评估低资源语言下基于示例查询的口语术语检测(QBE-STD)的特征提取方法,核心围绕Gronings语言相关的检测任务,通过单一压缩文件提供数据支持,可结合GitHub仓库的README获取详细信息。 文件详解 文件名称:gos-kdl.zip 文件格式:ZIP...
    packageimg
  • Fongbe_Speech_Dataset_贝宁Fongbe语言语音数据集

    2026年1月21日 30 178 158

    数据集概述 本数据集为贝宁主要使用的Fongbe语言语音数据集,包含语音音频文件、对应转录文本、数据集文档及元数据文件,用于支持Fongbe语言相关的语音技术研究与应用开发。 文件详解 压缩包文件 文件名称:Fongbe_Speech_Dataset.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三个核心部分:...
    packageimg