-
STDR_Based单麦克风降噪算法数据
2026年2月9日 30 197 188
数据集概述 本数据集为STDR单麦克风降噪算法相关数据,STDR算法基于人工神经网络检测、提取和重建语音中的频谱-时间特征,可在保留前景语音质量的同时降低背景噪声,提升语音可懂度,适用于助听器、自动语音识别等实时场景。数据集含1个文件。 文件详解 文件名称:data_csv_files.zip 文件格式:ZIP...
-
ASR_Based_牙科记录自动语音识别转录准确性研究数据集
2026年1月29日 30 110 31
数据集概述 本数据集为牙科记录自动语音识别转录准确性研究的分析数据集,包含支持相关分析的所有数据。初始仅向审稿阶段的编辑和同行评审人员开放,论文接收后将提供无限制访问。数据集含1个文件。 文件详解 文件名称:oaisr data2.xlsx 文件格式:XLSX...
-
Minspeech_Source_闽南语语音识别语料库数据v1_0_0
2026年1月26日 30 139 67
数据集概述 本数据集为闽南语方言语音识别语料库(Minspeech v1.0.0),包含用于自动语音识别的闽南语语音数据,整体以压缩包形式存储,未划分训练/测试集、数据/标签集及原始/处理数据,无额外目录层级。 文件详解 文件名称:Minspeech-1.0.0.zip 文件格式:ZIP...
-
辅音挑战语料库
2025年12月16日 30 101 85
数据集概述 该语料库提供用于支持人机辅音识别对比(安静与噪声环境)的数据集。包含二十四名英语母语者(十二女、十二男)的语音数据,覆盖二十四个英语辅音在九种元音环境、两种重音类型下的发音,共一万零三百六十八个语音样本,适用于自动语音识别实验的训练、开发和测试。 文件详解 技术说明文件: readme.pdf:...
-
DISPLACE2024_Track3_Based_多语言对话ASR评估标签完整数据
2025年12月11日 30 193 24
数据集概述 该数据集为DISPLACE2024挑战赛的官方数据,包含多语言多说话人自然对话内容,涵盖代码混合/切换、自然重叠、混响及噪声等多样化特征。数据用于挑战赛的开发与评估,未提供训练数据,仅包含开发和评估用的自然对话数据集,支持参与者进行模型适配。 文件详解 文件名称:Track3_ASR_eval_segment_labels.zip...
-
CitySpeechMix语音与城市声音混合模拟数据集
2025年12月7日 30 103 32
数据集概述 本数据集是模拟音频数据集,将LibriSpeech的语音片段与SONYC-UST的环境录音混合,生成语音与背景噪声的受控混合数据。包含三百七十一条混合音频和三百七十一条无语音城市环境录音,每条音频时长十秒,附语音转录和环境声音类别标签。 文件详解 压缩文件: cityspeechmix.zip: 包含数据集核心内容,分为两个子文件夹...
-
I_BiDaaS_TID_合成呼叫中心数据集
2025年12月4日 30 99 67
数据集概述 本数据集为模拟呼叫中心交互数据,基于真实电话交互与典型呼叫中心对话场景构建,由演员模拟客户与坐席角色,通过不同移动及固定电话设备录制。包含原始音频波形、自动语音识别转录文本及词段时间戳、置信度得分等信息。 文件详解 01_Synthetic CallCentresTID_I-...
-
波斯语自动语音识别清洁数据集-2021-pouyatoroghi
2025年6月1日 30 19 18
波斯语自动语音识别清洁数据集-2021-pouyatoroghi 数据来源:互联网公开数据 标签:波斯语,自动语音识别,音频数据,语音识别,ASR,噪声处理,语音数据,训练集 数据概述:...
-
自动语音识别文件数据集ASR-Dset-File-AutomaticSpeechRecognitionDataset-sibgatulislam
2025年5月28日 30 49 43
自动语音识别文件数据集ASR-Dset-File-AutomaticSpeechRecognitionDataset-sibgatulislam 数据来源:互联网公开数据 标签:语音识别,数据集,自动语音识别,机器学习,自然语言处理,人工智能,声学模型,语音技术 数据概述: 该数据集专注于自动语音识别(Automatic Speech...
-
自动语音识别书籍数据集-2021-garretttanzer
2025年4月22日 30 185 80
自动语音识别书籍数据集-2021-garretttanzer 数据来源:互联网公开数据 标签:语音识别,自动语音识别,ASROB,文本转语音,语音数据集,教育,科研,补充材料,工具 数据概述:...



