-
Lebedev_Based_50点正交阵列立体声与多通道脉冲响应测量数据集
数据集概述 本数据集包含50点Lebedev正交排列扬声器阵列的脉冲响应测量数据,覆盖多种立体声麦克风配置、32个Eigenmic胶囊及最高4阶Ambisonics格式,适用于立体声转Ambisonic上混算法的训练与研究,共包含2个文件。 文件详解 README.md 文件格式:Markdown...
-
Thorsten_Voice_Based_黑森方言语音数据集2023_09
数据集概述 本数据集为Thorsten-Voice项目的一部分,聚焦德语黑森方言(Hessisch),包含2108条语音短语。语音由Thorsten Müller录制,Dominik Kreutz优化音频,采用LJSpeech结构,采样率22.050Hz,单声道,归一化至-24dB,无首尾静音,以CC0协议开放授权。 文件详解...
-
OpenAIRlib_Based消声音频数据库2018年2月26日快照数据
数据集概述 本数据集是2018年2月26日从OpenAIRlib.net网站获取的“Anechoic Audio Database”的部分副本,以压缩包形式提供,便于学术用途下载。数据保留原始版权归属,文件类型单一,无目录结构或数据拆分。 文件详解 文件名称:anechoic_openAIRlib_ccsa.zip 文件格式:ZIP...
-
Multi_CAST_Tondano_多语言语音文本标注语料库数据2023
数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Tondano语言的语音文本标注数据,由Timothy Brickell于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中,用于多语言语音文本研究。 文件详解 文件名称:Multi-...
-
LibriTTS_Based_语音重音众包标注数据集_ICASSP2024
数据集概述 本数据集为ICASSP 2024相关论文的配套数据,包含对LibriTTS数据集train-clean-100分区中三千六百二十六条...
-
Spanish_Word_in_Noise_西班牙语噪声中词汇混淆语料库数据
数据集概述 本数据集为西班牙语噪声中词汇混淆的大规模语料库,包含三千二百三十五个由至少六位听众(共十五位)报告的一致性误感知案例。数据涵盖元数据表、对应混淆的语音与噪声信号音频波形文件及掩蔽波形文件,可用于研究西班牙语在噪声环境下的语音感知特性。 文件详解 文件名称:SpanishConfusionsCorpus.zip 文件格式:ZIP...
-
Open_Unmix_Pytorch_SDXDB21标签噪声基线模型训练数据
数据集概述 本数据集为SDXDB21标签噪声基线相关数据,包含Open-Unmix-Pytorch模型训练的配置信息、验证集歌曲ID及训练生成的模型文件。数据集涉及音频源分离任务,针对 vocals、bass、drums、other 四类音频源分别训练模型,共包含13个文件,支持音频源分离模型的训练与评估。 文件详解 模型与配置文件...
-
DCASE_2024_Task_9_Based_语言查询音频源分离开发集数据
数据集概述 本数据集是DCASE 2024 Task 9的开发集,由FSD50K和Clotho v2数据集的音频样本组成。FSD50K含51k+音频片段,通过AudioSet Ontology的200个类别手动标注;Clotho...
-
FADE_Based_空间条件与混响对语音可懂度预测准确性影响研究数据2025
数据集概述 本数据集为研究“模拟空间条件与混响对基于听觉辨别实验模拟框架(FADE)的语音可懂度预测准确性影响”的相关数据,包含实测与预测的语音接收阈值(SRTs)矩阵、房间脉冲响应文件及噪声渲染文件,支持语音可懂度预测模型的准确性分析。 文件详解 SRTs.mat(MAT格式) 包含字段:...
-
OfficeDial_Taskmaster_Based_多噪声场景人机对话数据集
数据集概述 本数据集为json格式文件,包含用户与智能语音助手(IVA)在不同噪声场景下的对话内容,格式适配自Taskmaster数据集结构。数据以对话为核心单元,记录对话ID、场景类型、噪声等级及多轮 utterance 信息,可用于智能语音交互系统的鲁棒性分析与优化。 文件详解 README.md 文件格式:Markdown...
-
Nsense_v1_0_Based_Android设备日常行为传感数据_201609
数据集概述 本数据集包含Nsense v1.0项目中9台Android设备(Copelabs1-8、12)的日常行为传感数据,采集于2016年9月12日至23日共12天。设备由同一机构人员携带,记录通勤、休闲、办公等日常场景数据,采样频率为每分钟1次,涵盖社交 proximity、距离、麦克风声音、身体活动四类传感信息。 文件详解...
-
Chinese_Speech_to_Text_Based中文学习者语音样本与转录数据
数据集概述 本数据集包含31名学习者的中文语音样本(单词语音),以及对应的转录文本和准确率评分,用于支持中文语音转文字相关的研究与应用。数据集仅包含一个文件,无训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:Dataset Chinese Speech to Text.xlsx 文件格式:XLSX...
-
AnglistikVoices_Based_第二语言英语学习者语音数据集v1_0_0
数据集概述 本数据集为非母语英语学习者语音数据集,包含15名非母语英语学习者的语音录音,总时长74分钟,每人60条音频样本。数据源自大学课程项目,采用Audio-Technica ATM75麦克风在录音棚录制,刺激语句来自Artie Bias Corpus,8名参与者提供句子级对齐数据,配套元数据含学习者语言背景信息。 文件详解...
-
RIR_Samples_Based_2018年夏秋季达姆施塔特与赫尔辛基房间脉冲响应测量数据
数据集概述 本数据集包含2018年夏秋季在达姆施塔特和赫尔辛基采集的房间脉冲响应(RIR)测量数据,用于评估DoubleEcho proximity验证系统。数据涵盖原始RIR样本录音、经解卷积和裁剪处理的音频文件,以及含RT60等特征的CSV文件,所有音频为16位单声道PCM Wave格式。 文件详解 压缩包文件...
-
Baule_Source_科特迪瓦阿比让Baule语言语音识别研究数据集_2022
数据集概述 本数据集用于支持Baule语言的自动语音识别研究,包含约565条语音记录,由4名志愿者(2男2女)在科特迪瓦阿比让录制,每人最多贡献141条。每条记录对应参与者逐句朗读的Baule语文本及配套音频,音频通过安卓手机在低噪音环境下采集,数据采集于2022年4月。 文件详解 文件名称:bci-datasets.zip 文件格式:ZIP(压缩包)...
-
Papuan_Voices_Supplement_巴布亚岛屿语音录音媒体文件补充数据集
数据集概述 本数据集是Papuan Voices数据集的补充,包含巴布亚岛各地语音录音的媒体文件。数据以压缩包形式提供,内含按文件名首两位字符分类的音频文件夹,每个音频文件对应主数据集的ID,可辅助语音转录研究。 文件详解 README.md 文件格式:MD...
-
Ben_Johnston_String_Quartet_No_7第三乐章音高使用列表数据
数据集概述 本数据集记录了Ben Johnston弦乐四重奏第七号第三乐章中使用的音高信息,包含超过七百个不同音高。数据关注音程分布(五百个音程小于两音分)、高频出现的schisma音程(八十三次),以及音高运动实现的滑音效果,为研究该作品的微音程结构提供基础数据。 文件详解 文件名称:String Quartet No 7 - Satz 3 -...
-
Dorado_Correaetal_DATA_绿头鸭噪声环境下声音可塑性实验数据2017
数据集概述 本数据集记录绿头鸭在噪声环境下的声音可塑性实验数据,包含绿头鸭幼鸭在噪声中发声信号的变化情况,是研究鸟类伦巴第效应及声音通讯进化机制的实验数据支撑,共包含一个文件。 文件详解 文件名称:Dorado-Correaetal.DATA.ducks.2017.xlsx 文件格式:XLSX...
-
BRS_SoundScape_Renderer_56通道环形扬声器阵列双耳房间扫描仿真数据
数据集概述 本数据集提供适用于直径3米的56通道环形扬声器阵列的双耳房间扫描(BRS)文件,支持立体声、环绕声或波场合成制作的动态双耳仿真,可通过SoundScape Renderer工具实现仿真播放,包含6个相关文件。 文件详解 文件名称:README.md 文件格式:.md 字段映射介绍:提供数据集使用说明,包括BRS文件用途、SoundScape...
-
Speech_Intelligibility_Based_频谱退化句子语音清晰度实验原始数据
数据集概述 本数据集记录了频谱退化句子的语音清晰度实验数据,旨在探究振幅与相位信息对语音清晰度的差异化贡献。实验中听者需在听取频谱退化的句子后完成单词识别任务,刺激通过分割句子、独立解相关各片段的振幅与相位成分生成,包含三种片段长度:30毫秒(音素长度)、250毫秒(音节长度)及完整句子(未分割)。 文件详解 原始数据文件(30毫秒窗口)...



