数据集 - 海数据

Lebedev_Based_50点正交阵列立体声与多通道脉冲响应测量数据集

2026年1月21日

数据集概述本数据集包含50点Lebedev正交排列扬声器阵列的脉冲响应测量数据，覆盖多种立体声麦克风配置、32个Eigenmic胶囊及最高4阶Ambisonics格式，适用于立体声转Ambisonic上混算法的训练与研究，共包含2个文件。文件详解 README.md 文件格式：Markdown...

ZIP

Thorsten_Voice_Based_黑森方言语音数据集2023_09

2026年1月21日

数据集概述本数据集为Thorsten-Voice项目的一部分，聚焦德语黑森方言（Hessisch），包含2108条语音短语。语音由Thorsten Müller录制，Dominik Kreutz优化音频，采用LJSpeech结构，采样率22.050Hz，单声道，归一化至-24dB，无首尾静音，以CC0协议开放授权。文件详解...

ZIP

OpenAIRlib_Based消声音频数据库2018年2月26日快照数据

2026年1月21日

数据集概述本数据集是2018年2月26日从OpenAIRlib.net网站获取的“Anechoic Audio Database”的部分副本，以压缩包形式提供，便于学术用途下载。数据保留原始版权归属，文件类型单一，无目录结构或数据拆分。文件详解文件名称：anechoic_openAIRlib_ccsa.zip 文件格式：ZIP...

ZIP

Multi_CAST_Tondano_多语言语音文本标注语料库数据2023

2026年1月21日

数据集概述本数据集为Multi-CAST多语言标注语音文本语料库的一部分，包含Tondano语言的语音文本标注数据，由Timothy Brickell于2023年贡献，收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中，用于多语言语音文本研究。文件详解文件名称：Multi-...

ZIP

LibriTTS_Based_语音重音众包标注数据集_ICASSP2024

2026年1月21日

数据集概述本数据集为ICASSP 2024相关论文的配套数据，包含对LibriTTS数据集train-clean-100分区中三千六百二十六条...

ZIP

Spanish_Word_in_Noise_西班牙语噪声中词汇混淆语料库数据

2026年1月20日

数据集概述本数据集为西班牙语噪声中词汇混淆的大规模语料库，包含三千二百三十五个由至少六位听众（共十五位）报告的一致性误感知案例。数据涵盖元数据表、对应混淆的语音与噪声信号音频波形文件及掩蔽波形文件，可用于研究西班牙语在噪声环境下的语音感知特性。文件详解文件名称：SpanishConfusionsCorpus.zip 文件格式：ZIP...

ZIP

Open_Unmix_Pytorch_SDXDB21标签噪声基线模型训练数据

2026年1月20日

数据集概述本数据集为SDXDB21标签噪声基线相关数据，包含Open-Unmix-Pytorch模型训练的配置信息、验证集歌曲ID及训练生成的模型文件。数据集涉及音频源分离任务，针对 vocals、bass、drums、other 四类音频源分别训练模型，共包含13个文件，支持音频源分离模型的训练与评估。文件详解模型与配置文件...

ZIP

DCASE_2024_Task_9_Based_语言查询音频源分离开发集数据

2026年1月20日

数据集概述本数据集是DCASE 2024 Task 9的开发集，由FSD50K和Clotho v2数据集的音频样本组成。FSD50K含51k+音频片段，通过AudioSet Ontology的200个类别手动标注；Clotho...

ZIP

FADE_Based_空间条件与混响对语音可懂度预测准确性影响研究数据2025

2026年1月19日

数据集概述本数据集为研究“模拟空间条件与混响对基于听觉辨别实验模拟框架（FADE）的语音可懂度预测准确性影响”的相关数据，包含实测与预测的语音接收阈值（SRTs）矩阵、房间脉冲响应文件及噪声渲染文件，支持语音可懂度预测模型的准确性分析。文件详解 SRTs.mat（MAT格式）包含字段：...

ZIP

OfficeDial_Taskmaster_Based_多噪声场景人机对话数据集

2026年1月19日

数据集概述本数据集为json格式文件，包含用户与智能语音助手（IVA）在不同噪声场景下的对话内容，格式适配自Taskmaster数据集结构。数据以对话为核心单元，记录对话ID、场景类型、噪声等级及多轮 utterance 信息，可用于智能语音交互系统的鲁棒性分析与优化。文件详解 README.md 文件格式：Markdown...

ZIP

Nsense_v1_0_Based_Android设备日常行为传感数据_201609

2026年1月18日

数据集概述本数据集包含Nsense v1.0项目中9台Android设备（Copelabs1-8、12）的日常行为传感数据，采集于2016年9月12日至23日共12天。设备由同一机构人员携带，记录通勤、休闲、办公等日常场景数据，采样频率为每分钟1次，涵盖社交 proximity、距离、麦克风声音、身体活动四类传感信息。文件详解...

ZIP

Chinese_Speech_to_Text_Based中文学习者语音样本与转录数据

2026年1月18日

数据集概述本数据集包含31名学习者的中文语音样本（单词语音），以及对应的转录文本和准确率评分，用于支持中文语音转文字相关的研究与应用。数据集仅包含一个文件，无训练/测试、数据/标签或原始/处理数据的划分。文件详解文件名称：Dataset Chinese Speech to Text.xlsx 文件格式：XLSX...

ZIP

AnglistikVoices_Based_第二语言英语学习者语音数据集v1_0_0

2026年1月18日

数据集概述本数据集为非母语英语学习者语音数据集，包含15名非母语英语学习者的语音录音，总时长74分钟，每人60条音频样本。数据源自大学课程项目，采用Audio-Technica ATM75麦克风在录音棚录制，刺激语句来自Artie Bias Corpus，8名参与者提供句子级对齐数据，配套元数据含学习者语言背景信息。文件详解...

ZIP

RIR_Samples_Based_2018年夏秋季达姆施塔特与赫尔辛基房间脉冲响应测量数据

2026年1月12日

数据集概述本数据集包含2018年夏秋季在达姆施塔特和赫尔辛基采集的房间脉冲响应（RIR）测量数据，用于评估DoubleEcho proximity验证系统。数据涵盖原始RIR样本录音、经解卷积和裁剪处理的音频文件，以及含RT60等特征的CSV文件，所有音频为16位单声道PCM Wave格式。文件详解压缩包文件...

ZIP

Baule_Source_科特迪瓦阿比让Baule语言语音识别研究数据集_2022

2026年1月15日

数据集概述本数据集用于支持Baule语言的自动语音识别研究，包含约565条语音记录，由4名志愿者（2男2女）在科特迪瓦阿比让录制，每人最多贡献141条。每条记录对应参与者逐句朗读的Baule语文本及配套音频，音频通过安卓手机在低噪音环境下采集，数据采集于2022年4月。文件详解文件名称：bci-datasets.zip 文件格式：ZIP（压缩包）...

ZIP

Papuan_Voices_Supplement_巴布亚岛屿语音录音媒体文件补充数据集

2026年1月14日

数据集概述本数据集是Papuan Voices数据集的补充，包含巴布亚岛各地语音录音的媒体文件。数据以压缩包形式提供，内含按文件名首两位字符分类的音频文件夹，每个音频文件对应主数据集的ID，可辅助语音转录研究。文件详解 README.md 文件格式：MD...

ZIP

Ben_Johnston_String_Quartet_No_7第三乐章音高使用列表数据

2026年1月13日

数据集概述本数据集记录了Ben Johnston弦乐四重奏第七号第三乐章中使用的音高信息，包含超过七百个不同音高。数据关注音程分布（五百个音程小于两音分）、高频出现的schisma音程（八十三次），以及音高运动实现的滑音效果，为研究该作品的微音程结构提供基础数据。文件详解文件名称：String Quartet No 7 - Satz 3 -...

ZIP

Dorado_Correaetal_DATA_绿头鸭噪声环境下声音可塑性实验数据2017

2026年1月13日

数据集概述本数据集记录绿头鸭在噪声环境下的声音可塑性实验数据，包含绿头鸭幼鸭在噪声中发声信号的变化情况，是研究鸟类伦巴第效应及声音通讯进化机制的实验数据支撑，共包含一个文件。文件详解文件名称：Dorado-Correaetal.DATA.ducks.2017.xlsx 文件格式：XLSX...

ZIP

BRS_SoundScape_Renderer_56通道环形扬声器阵列双耳房间扫描仿真数据

2026年1月12日

数据集概述本数据集提供适用于直径3米的56通道环形扬声器阵列的双耳房间扫描（BRS）文件，支持立体声、环绕声或波场合成制作的动态双耳仿真，可通过SoundScape Renderer工具实现仿真播放，包含6个相关文件。文件详解文件名称：README.md 文件格式：.md 字段映射介绍：提供数据集使用说明，包括BRS文件用途、SoundScape...

ZIP

Speech_Intelligibility_Based_频谱退化句子语音清晰度实验原始数据

2026年1月12日

数据集概述本数据集记录了频谱退化句子的语音清晰度实验数据，旨在探究振幅与相位信息对语音清晰度的差异化贡献。实验中听者需在听取频谱退化的句子后完成单词识别任务，刺激通过分割句子、独立解相关各片段的振幅与相位成分生成，包含三种片段长度：30毫秒（音素长度）、250毫秒（音节长度）及完整句子（未分割）。文件详解原始数据文件（30毫秒窗口）...

ZIP

找到546个数据集

注册成功！