找到543个数据集

标签: 语音识别

过滤结果
  • 瓦努阿图之声数据集2024

    2025年12月19日 30 55 50

    数据集概述 该数据集为“瓦努阿图之声”项目数据,核心包含与瓦努阿图相关的语音音频内容,以压缩包形式存储,未提供具体内容预览,整体结构简洁,无训练测试或原始处理数据的拆分。 文件详解 文件名称: lexibank/vanuatuvoices-v1.3.zip 文件格式: ZIP (.zip) 文件说明:...
    packageimg
  • 中国云南拉祜族黑拉祜语低音调代际差异数据集

    2025年12月19日 30 5 3

    数据集概述 本数据集为《中国云南拉祜族黑拉祜语低音调代际差异》研究的补充材料,包含黑拉祜语声调的声学测量数据、分析脚本及附录文档,支持语言声调变化的代际差异研究。 文件详解 附录文档: supplemental material appendices.pdf: PDF格式,包含研究相关的附录内容,如词汇表、图片书、交叉表、F0轨迹图和LME模型结果等。...
    packageimg
  • LJ语音_国际音标对齐转录数据集

    2025年12月11日 30 39 23

    数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
    packageimg
  • 俄语语音重音感知研究与语音识别技术应用

    2025年12月16日 30 5 0

    数据集概述 本数据集聚焦俄语语音重音感知问题,结合语音识别技术,分析俄语作为外语学习者的语音特点,通过神经网络算法识别其语音偏差,评估重音对沟通质量的影响,为俄语教学提供实践建议。 文件详解 文件名称: Turg’unboyev Abdullajon Abdubanno o’g’li.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 基于隐马尔可夫模型的语音特征提取数据集

    2025年12月14日 30 181 24

    数据集概述 该数据集围绕语音识别展开,提出结合隐马尔可夫模型(HMM)的混合语音识别模型,通过噪声去除、语音停顿检测、分帧加窗特征提取等阶段实现语音转文本,使用Praat工具实施,模型评估指标为F值(98%)和准确率(99%)。 文件详解 文件名称:Suppl File - Speech to Text - Latest.pdf 文件格式:PDF...
    packageimg
  • 圣维森特岛佛得角克里奥尔语数据集2019

    2025年12月13日 30 144 68

    数据集概述 本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。 文件详解 该数据集包含11个文件,按类型分类说明如下: - PDF文档类(共4个): -...
    packageimg
  • 法国朗伯德语音数据集

    2025年12月12日 30 11 3

    数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
    packageimg
  • 基于树莓派的安全语音识别服务开发文档

    2025年12月12日 30 89 64

    数据集概述 本数据集为一份关于在树莓派平台上开发安全语音识别服务的文档资料,包含相关技术实现的详细内容,为语音识别服务的开发与安全优化提供参考。 文件详解 文件名称: 53 7655.pdf 文件格式: PDF (.pdf) 文件内容: 文档类型文件,内容围绕在树莓派上开发安全语音识别服务展开,具体字段信息未提供。 适用场景 嵌入式系统开发研究:...
    packageimg
  • 同形异义词与同音异义词关联数据集

    2025年12月11日 30 204 102

    数据集概述 本数据集聚焦于同形异义词与同音异义词的关联研究,包含一份PDF格式的相关文档,为语言文字领域中词汇语义与语音关系的分析提供基础资料。 文件详解 文件名称: Jurayeva Zulayxo Shamsiddinovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • 英语音素范围_发音方式与发音部位探索数据集

    2025年12月10日 30 190 133

    数据集概述 本数据集聚焦英语语言中的音素,围绕发音方式与发音部位展开探索,通过单篇PDF文档呈现相关研究内容,为英语语音学领域的音素特征分析提供基础资料。 文件详解 文件名称:GaniyevaDildoraAzizovna.pdf 文件格式:PDF(.pdf) 文件内容:围绕英语音素的发音方式与发音部位主题展开的文档,具体内容需查阅PDF原文 适用场景...
    packageimg
  • 旁遮普方言语音数据集

    2025年12月9日 30 49 28

    数据集概述 本数据集包含旁遮普方言的语音录音数据,同时提供相关的模型代码文件,为旁遮普方言语音研究提供基础数据支持。 文件详解 文件名称: FemaleMale.html 文件格式: HTML (.html) 内容说明: 包含与旁遮普方言语音模型相关的代码 文件名称: Dataset.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
    packageimg
  • Jamendo歌唱语音检测语料库

    2025年12月6日 30 125 82

    数据集概述 该数据集是一个公开语料库,包含九十三首采用知识共享许可的音乐作品,标注内容分为有语音(演唱或口语)和无语音两类,为歌唱语音检测研究提供标注数据支持。 文件详解 文件名称: jamando.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含九十三首标注了语音(演唱或口语)和无语音类别的音乐作品,未提供具体字段映射信息 适用场景...
    packageimg
  • 教室环境音频与三维模型数据集

    2025年12月5日 30 113 67

    数据集概述 该数据集包含荷兰小学教室的环境音频(含儿童嘈杂声、房间脉冲响应)及教室三维模型,音频采用Ambisonics格式存储,模型提供Blender和OBJ文件,为虚拟教室环境构建提供多模态数据支持。 文件详解 文档文件: Classroom Environment Description Document...
    packageimg
  • THCHS_30_国际音标对齐转录数据集

    2025年12月4日 30 18 15

    数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...
    packageimg
  • 有声书数据音频片段掩蔽时间数据集

    2025年11月12日 30 58 44

    有声书数据音频片段掩蔽时间数据集_Audiobook_Data_Audio_Snippet_Masking_Time 数据来源:互联网公开数据 标签:有声书, 音频处理, 语音识别, 时间序列分析, 数据掩蔽, 机器学习, 信号处理, 数据标注 数据概述: 该数据集包含有声书音频数据,记录了音频片段的掩蔽处理信息。主要特征如下:...
    packageimg
  • 语音识别模型训练损失与WER评估数据集

    2025年11月12日 30 170 35

    语音识别模型训练损失与WER评估数据集_Speech_Recognition_Model_Training_Loss_and_WER_Evaluation_Dataset 数据来源:互联网公开数据 标签:语音识别, 深度学习, 模型评估, 损失函数, WER, 语音识别模型, 数据分析, 机器学习 数据概述:...
    packageimg
  • 电视剧情感识别多模态数据集

    2025年11月12日 30 90 70

    电视剧情感识别多模态数据集_TV_Series_Emotion_Recognition_Multimodal_Dataset 数据来源:互联网公开数据 标签:情感识别, 多模态, 语音识别, 文本分析, 视频分析, 情感分类, 电视剧, 机器学习 数据概述:...
    packageimg
  • 语音活动检测_VAD_数据集

    2025年11月3日 30 191 162

    语音活动检测_VAD_数据集_Voice_Activity_Detection_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音处理, VAD, 声音事件检测, 音频分析, 时间戳, 机器学习, 深度学习 数据概述: 该数据集包含从YouTube视频中提取的语音活动检测(VAD)数据,记录了音频片段的起始和结束时间戳。主要特征如下:...
    packageimg
  • 情感语音识别多模态数据集

    2025年10月16日 60 199 19

    情感语音识别多模态数据集_Multimodal_Emotion_Recognition_Dataset 数据来源:互联网公开数据 标签:情感识别, 语音识别, 图像识别, 多模态, 情绪分析, 深度学习, 音频特征, 图像特征 数据概述: 该数据集包含语音、图像及其对应的标注情感信息,用于情感语音识别与多模态情感分析。主要特征如下:...
    packageimg
  • 有声小说文本音频数据集

    2025年11月1日 30 192 119

    有声小说文本音频数据集_Audiobook_Text_Audio_Dataset 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 有声书, 文本转语音, 语音合成, 声学模型, 文本语料, 语音数据 数据概述: 该数据集包含有声小说文本和对应的音频文件,旨在为语音处理和自然语言处理任务提供支持。主要特征如下:...
    packageimg