找到546个数据集

标签: 语音处理

过滤结果
  • 呼吸音新冠肺炎诊断数据集

    2026年2月17日 30 35 33

    呼吸音新冠肺炎诊断数据集_Respiratory_Sound_COVID_19_Diagnosis_Dataset 数据来源:互联网公开数据 标签:新冠肺炎, 呼吸音, 疾病诊断, 音频分析, 机器学习, 语音识别, 医学研究, 声音信号 数据概述: 该数据集包含来自公开平台的呼吸音数据,旨在用于新冠肺炎(COVID-19)的诊断研究。主要特征如下:...
    packageimg
  • 日琉方言_疑问文调查_语言研究数据

    2026年2月15日 30 191 105

    数据集概述 本数据集为日琉方言疑问文及疑问表现的描述与对照研究提供支持,包含用于调查的问卷(调查票)及使用该问卷采集的方言调查结果。数据集因容量分为两部分,涵盖青森、茨城、山梨等多地方言数据,部分方言附语音资料,另含调查票解说文章。 文件详解 主文件 文件名称:intr_20230323_1.zip 文件格式:ZIP...
    packageimg
  • 三维音色空间公共维度坐标数据

    2026年2月12日 30 172 120

    数据集概述 本数据集提供三维音色空间公共维度的坐标信息,包含描述、刺激名称及对应坐标数据,用于表征不同音色在三维空间中的位置分布,支持音频音色的量化分析与研究。 文件详解 文件名称:The coordinates along common dimensions for 3-dimendional timbre space.json 文件格式:JSON...
    packageimg
  • 基于音乐音符的盲源分离实验数据

    2026年2月12日 30 146 124

    数据集概述 本数据集包含12组非谐波关系的三音符组合音频,提取自RWC乐器声音数据库,用于博士论文中音频源分离系统的性能评估,涉及1个压缩文件,无分层目录结构。 文件详解 文件名称:ASS-Musical-Notes-V01.zip 文件格式:ZIP...
    packageimg
  • STDR_Based单麦克风降噪算法数据

    2026年2月9日 30 175 87

    数据集概述 本数据集为STDR单麦克风降噪算法相关数据,STDR算法基于人工神经网络检测、提取和重建语音中的频谱-时间特征,可在保留前景语音质量的同时降低背景噪声,提升语音可懂度,适用于助听器、自动语音识别等实时场景。数据集含1个文件。 文件详解 文件名称:data_csv_files.zip 文件格式:ZIP...
    packageimg
  • 京剧无伴奏清唱音节边界与时值标注zip文件

    2026年2月1日 30 162 118

    数据集概述 本数据集包含京剧专业及业余演唱者无伴奏演唱的音节边界标注与音节时长标注,是相关研究的实验数据。数据集整合了音频文件与标注文件,音频由C4DM Queen Mary University of London和MTG-UPF两所机构录制,标注采用Textgrid和CSV格式,同时提供解析代码。 文件详解...
    packageimg
  • TRIOS_Based_乐谱对齐音乐多轨录音数据集

    2026年1月31日 30 187 160

    数据集概述 本数据集为乐谱对齐的多轨录音数据集,包含5首室内乐三重奏作品的分离音轨及对齐的MIDI乐谱,可支持乐谱引导源分离、自动音乐转录等音乐研究任务,数据集整体打包为一个压缩文件。 文件详解 文件名称:TRIOS Dataset.zip 文件格式:ZIP...
    packageimg
  • COLOR_Project_颜色与黑色单词阅读共振峰实验数据

    2026年2月8日 30 30 16

    数据集概述 本数据集包含COLOR项目中,受试者在颜色单词阅读(WRC)和黑色单词阅读(WRB)任务中各试验的共振峰数值。数据覆盖实验1-4阶段,包含目标距离信息,所有文件已匿名化处理,共2个文件。 文件详解 文件名称:WRC_phase1234_incl_distance_to_target_anonymized.xlsx 文件格式:XLSX...
    packageimg
  • Benchmark_Database_语音对齐手动编辑基准数据

    2026年2月8日 30 141 5

    数据集概述 本数据集为语音对齐基准数据库,包含十五个压缩文件,涵盖斯拉夫语、法语、罗曼语等多种语言的手动编辑语音对齐数据,旨在为历史语言学和方言学领域的自动对齐算法提供测试与性能优化的基准平台,覆盖语音对齐分析中的典型问题。 文件详解 压缩文件组(archive_files)...
    packageimg
  • SELDnet_Based声音事件定位检测联合测量结果数据2019

    2026年2月6日 0 62 8

    数据集概述 本数据集为SELDnet方法在声音事件定位与检测任务中的结果,对应5、25、75个训练周期的不同状态,基于TAU Spatial Sound Events 2019麦克风阵列数据集的四组交叉验证分割数据生成,含4个文件,用于支持声音事件定位与检测的技术研究。 文件详解 压缩文件组(Archive files)...
    packageimg
  • IDMT_Source_深度学习音频效果黑箱建模研究数据_2019

    2026年2月6日 0 30 15

    数据集概述 本数据集是论文“Deep Learning for Black-Box Modeling of Audio Effects”的配套音频样本,包含贝斯和吉他的干声与湿声录音。干声源自IDMT-SMT-Audio-Effects数据集,湿声由Universal Audio 6176设备及145...
    packageimg
  • Unmixing_Addendum_单通道盲音频源分离听感测试补充数据

    2026年2月6日 0 141 139

    数据集概述 本数据集为Toby Stokes博士项目“Improving the perceptual quality of single-channel blind audio source separation”的补充档案,包含听感测试代码与数据,用于补充原音频分离研究数据,支持单通道盲音频源分离的感知质量分析。 文件详解...
    packageimg
  • CSIBE_卧室常见声音事件识别数据集2018

    2026年2月1日 30 105 16

    数据集概述 本数据集为卧室常见声音事件识别数据集(CSIBE),包含人类语音、婴儿哭声、猫叫、狗吠等14类主要声音事件,以及门、抽屉、键盘等14类背景环境声音。数据集分为原始音频(CSIBE-RAW)和机器人录制音频(CSIBE-AIBO)两部分,可用于智能家居场景下的声音事件识别研究。 文件详解 CSIBE-RAW...
    packageimg
  • EMOSEC_Based_双语语音情感描述数据集

    2026年2月1日 30 109 13

    数据集概述 本数据集为基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,整合了语音数据与对应的情感描述内容,以单一JSON文件形式提供,未划分训练/测试集或数据/标签集。 文件详解 文件名称:merged_file.json 文件格式:JSON...
    packageimg
  • EMOSEC_Based_中英语音情感描述数据集

    2026年2月1日 30 58 26

    数据集概述 本数据集为EMOSEC Dataset,是基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,包含中文和英文的语音情感描述内容,以合并后的JSON文件形式提供,可用于语音情感分析相关研究。 文件详解 文件名称:merged_file.json 文件格式:JSON...
    packageimg
  • NUBUC_Based_语境控制口语故事语料库数据

    2026年1月31日 30 49 41

    数据集概述 本数据集为NyU-BU语境控制故事语料库(NUBUC),是兼顾自然性与实验可控性的口语语料库。包含8个独特故事的16段高质量录音,由男女演员各录制一遍,每故事含128句约2000词,围绕关键词构建,关键词在多语言维度匹配,语境参数(先验/局部语境强弱、句子位置早晚)被操控。 文件详解 文件名称:public.zip 文件格式:ZIP...
    packageimg
  • FeatureTTS_Based_音系特征映射数据

    2026年1月31日 30 122 26

    数据集概述 本数据集为FeatureTTS相关的音系特征映射数据,包含APRAbet与SAMPA、拼音与SAMPA-SC、SAMPA/SAMPA-SC与基于FUL的音系特征之间的映射关系,用于语音合成领域的音系特征转换与处理。 文件详解 文件名称:CMU2SAMPA_Pinyin2SAMPA_SAMPA2Features.xlsx 文件格式:XLSX...
    packageimg
  • MowIT_Based_农业机器人声音异常检测数据集

    2026年1月31日 30 134 81

    数据集概述 本数据集包含农业机器人MowIT割草工具的声音异常检测相关数据,通过两个麦克风采集单通道音频(采样率44100Hz、16位分辨率),同时记录集成的惯性测量单元(IMU)数据。数据在两种户外草地环境下采集,涵盖不同切割工具(修剪线、刀片)、配置组合及异常状态(电机压力停机等),为农业机器人声音异常检测提供实验数据。 文件详解...
    packageimg
  • ICASSP_Based_板弹簧混响建模音频样本数据

    2026年1月31日 30 119 93

    数据集概述 本数据集是ICASSP 2020论文《Modeling plate and spring reverberation using a DSP-informed deep neural network》的配套音频样本,包含干、湿两种状态的贝斯和吉他录音,涵盖板混响(VST插件生成)与弹簧混响(Accutronics...
    packageimg
  • PB2007_Based_法语声学_发音同步语音数据集

    2026年1月31日 30 60 16

    数据集概述 本数据集为PB2007法语声学-发音语音数据库,包含法语语音的声学信号与电磁发音仪(EMA)记录的发音运动数据,同步采集自法语受试者,支持语音生产机制研究与声学-发音转换模型开发。 文件详解 _seq/目录 内容:电磁发音仪(EMA)数据,采样频率100Hz...
    packageimg