-
SPECS_Based_语音风格关键词采集与背景噪声数据集
2026年1月29日 30 29 15
数据集概述 本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。 文件详解 主文件 文件名称:SPECS.zip 文件格式:ZIP...
-
lexibank_Papuan_Voices巴布亚语音数据集
2026年1月29日 30 193 4
数据集概述 本数据集为Papuan Voices语音数据,包含一份压缩文件,主要内容涉及巴布亚地区的语音记录,属于语言类数据集,可用于语言学相关研究与分析。 文件详解 文件名称:lexibank/papuanvoices-v1.2.zip 文件格式:ZIP...
-
Fongbe_Speech_Dataset_贝宁Fongbe语言语音数据集
2026年1月21日 30 71 39
数据集概述 本数据集为贝宁主要使用的Fongbe语言语音数据集,包含语音音频文件、对应转录文本、数据集文档及元数据文件,用于支持Fongbe语言相关的语音技术研究与应用开发。 文件详解 压缩包文件 文件名称:Fongbe_Speech_Dataset.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三个核心部分:...
-
Thorsten_Voice_Based_黑森方言语音数据集2023_09
2026年1月21日 30 144 47
数据集概述 本数据集为Thorsten-Voice项目的一部分,聚焦德语黑森方言(Hessisch),包含2108条语音短语。语音由Thorsten Müller录制,Dominik Kreutz优化音频,采用LJSpeech结构,采样率22.050Hz,单声道,归一化至-24dB,无首尾静音,以CC0协议开放授权。 文件详解...
-
LibriTTS_Based_语音重音众包标注数据集_ICASSP2024
2026年1月21日 30 118 99
数据集概述 本数据集为ICASSP 2024相关论文的配套数据,包含对LibriTTS数据集train-clean-100分区中三千六百二十六条...
-
AnglistikVoices_Based_第二语言英语学习者语音数据集v1_0_0
2026年1月18日 30 174 39
数据集概述 本数据集为非母语英语学习者语音数据集,包含15名非母语英语学习者的语音录音,总时长74分钟,每人60条音频样本。数据源自大学课程项目,采用Audio-Technica ATM75麦克风在录音棚录制,刺激语句来自Artie Bias Corpus,8名参与者提供句子级对齐数据,配套元数据含学习者语言背景信息。 文件详解...
-
Baule_Source_科特迪瓦阿比让Baule语言语音识别研究数据集_2022
2026年1月15日 30 82 43
数据集概述 本数据集用于支持Baule语言的自动语音识别研究,包含约565条语音记录,由4名志愿者(2男2女)在科特迪瓦阿比让录制,每人最多贡献141条。每条记录对应参与者逐句朗读的Baule语文本及配套音频,音频通过安卓手机在低噪音环境下采集,数据采集于2022年4月。 文件详解 文件名称:bci-datasets.zip 文件格式:ZIP(压缩包)...
-
The_Hurricane_Challenge_Interspeech_语音增强数据集_2013
2026年1月11日 30 145 109
数据集概述 本数据集是2013年Interspeech举办的The Hurricane Challenge国际语音清晰度增强评估活动的数据集,包含立体声音频文件,其中通道1为干净语音,通道2为噪声。数据集提供两种噪声类型(平稳语音形状噪声、竞争语音),每种噪声含三种信噪比水平,用于在不改变均方根电平及特定时长约束下增强语音清晰度。 文件详解...
-
语音转灯具语音数据集
2025年12月13日 30 39 2
数据集概述 该数据集包含一千零六十个音频文件,总时长约一点一八小时,收录了五名受试者(两名女性、三名男性)用英语和西班牙语朗读“文本转灯具”数据集测试样本提示语的语音录音,数据采集符合伦理规范与数据保护法规。 文件详解 核心文件: data.zip:压缩包格式,包含所有加密的音频文件,需使用指定脚本解密 解密工具:...
-
法国朗伯德语音数据集
2025年12月12日 30 147 22
数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
-
THCHS_30_国际音标对齐转录数据集
2025年12月4日 30 16 11
数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...
-
阿拉伯语语音对话情感分析数据集
2025年9月25日 30 38 11
阿拉伯语语音对话情感分析数据集_Arabic_Speech_Dialogue_Emotion_Analysis 数据来源:互联网公开数据 标签:语音识别, 情感分析, 阿拉伯语, 语音数据集, 文本转录, 声学特征, 情绪识别, 多模态数据 数据概述:...
-
多语言语音词汇识别数据集
2025年7月24日 30 118 52
多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集 数据概述: 该数据集包含来自多个来源的语音数据,记录了不同语言的语音词汇及其对应的文本转录。主要特征如下:...
-
印地语语音转录数据集
2025年7月7日 30 94 0
印地语语音转录数据集_Hindi_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 印地语, 声学模型, 语言模型, 语音数据集, 深度学习, 印度 数据概述: 该数据集包含来自多个来源的印地语语音数据,记录了印地语语音的音频文件及其对应的文本转录。主要特征如下:...
-
越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset
2025年6月23日 30 106 50
越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 越南语, 语音数据集, 文本标注, 自然语言处理, 声学模型, 深度学习 数据概述:...
-
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad
2025年5月30日 30 184 146
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad 数据来源:互联网公开数据 标签:语音识别, 诺阿卡利语, 语音数据集, 声学模型, 语言学, 文本转录, 语音转文本, 深度学习 数据概述:...
-
语音识别意图分类数据集SpeechRecognitionIntentClassificationDataset-kkoyias
2025年5月28日 30 195 149
语音识别意图分类数据集SpeechRecognitionIntentClassificationDataset-kkoyias 数据来源:互联网公开数据 标签:语音识别, 意图识别, 声学模型, 语音数据集, 机器学习, 深度学习, 自然语言处理, 分类任务 数据概述:...
-
白俄罗斯语语音合成数据集BelarusianSpeechSynthesisDataset-siarheys
2025年5月18日 30 93 6
白俄罗斯语语音合成数据集BelarusianSpeechSynthesisDataset-siarheys 数据来源:互联网公开数据 标签:语音识别, 语音合成, 文本转语音, 白俄罗斯语, 语音数据集, 深度学习, 自然语言处理, 声学模型 数据概述: 该数据集包含来自开源项目的白俄罗斯语语音数据,用于语音合成模型的训练和评估。主要特征如下:...
-
马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy
2025年5月17日 30 67 49
马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy 数据来源:互联网公开数据 标签:语音识别, 马达加斯加语, 声学模型, 语音转录, 深度学习, 语音数据集, 语言学, 音频数据 数据概述:...
-
越南语语音识别训练数据集VietnameseSpeechRecognitionTrainingDataset-quanghoang123
2025年5月14日 30 18 8
越南语语音识别训练数据集VietnameseSpeechRecognitionTrainingDataset-quanghoang123 数据来源:互联网公开数据 标签:语音识别, 越南语, 语音数据集, 声学模型, 语言模型, 语音转录, 深度学习, 自然语言处理 数据概述:...



