找到552个数据集

标签: 语音识别

过滤结果
  • Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

    2026年1月7日 30 68 17

    数据集概述 本数据集为Multi-CAST多语言语音文本标注语料库的一部分,包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布,是多语言口语文本标注资源的重要组成,可用于相关语言研究与自然语言处理应用。 文件详解 文件名称:Multi-CAST/mcnkurd-v2311.zip 文件格式:ZIP...
    packageimg
  • AI_Controlled_Vocabulary_人工智能研究创新领域受控词汇表_Version2

    2026年1月7日 30 12 4

    数据集概述 本数据集为人工智能(AI)领域研究与创新活动设计的受控词汇表,由SIRIS Academic联合意大利艾米利亚-罗马涅大区ART-ER与西班牙加泰罗尼亚政府构建。词汇表基于ACM分类系统,整合领域专家意见,覆盖机器学习、计算机视觉等六大子领域,共收录833个关键词,用于标准化识别AI相关研发项目与学术文献。 文件详解 文件名称:AI...
    packageimg
  • Multi_CAST_Source_Sanzhi_Dargwa多语言语音标注文本数据_2311版本

    2026年1月6日 30 190 182

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Sanzhi Dargwa语言的标注语音文本数据,版本为2311。数据集由班贝格大学发布,是多语言语音语言学研究的结构化资源,仅包含一个压缩文件。 文件详解 文件名称:Multi-CAST/mcsanzhi-v2311.zip 文件格式:ZIP...
    packageimg
  • Data_from_PlosOne_人工耳蜗单极检测阈值对神经兴奋空间选择性及语音识别影响的研究数据

    2026年1月4日 30 14 2

    数据集概述 本数据集围绕人工耳蜗单极检测阈值展开研究,旨在探究其对神经兴奋空间选择性的预测能力及对语音识别的影响。通过测量不同刺激参数下的检测阈值,结合前掩蔽范式评估神经兴奋空间选择性,并测试不同电极激活方案下的语音识别表现,为人工耳蜗优化提供数据支持。 文件详解...
    packageimg
  • Multi_CAST_Based_多语言口语文本标注语料库_Mandarin_Version2311

    2026年1月4日 0 185 40

    数据集概述 本数据集为Multi-CAST多语言口语标注文本语料库的中文部分,由Maria Vollmer于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中。数据以压缩包形式提供,是研究中文口语标注文本的基础语料资源。 文件详解 文件名称:Multi-...
    packageimg
  • Sharvard_Spanish_Balanced_音素平衡西班牙语语音数据完整集合

    2025年12月21日 30 193 187

    数据集概述 该数据集包含音素平衡的西班牙语句子列表及男女说话人的完整句子录音,适用于语音清晰度测试,基于V. Aubanel等2014年发表的相关论文构建。 文件详解 文件名称:lists-ortho.pdf;文件格式:PDF;内容:音素平衡句子列表,关键词为粗体 文件名称:lists-phonemic-...
    packageimg
  • AUGUSTA语音转文本语言模型训练数据集

    2025年12月22日 30 183 109

    数据集概述 该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集,AUGUSTA是基于OpenAI Whisper定制的模型,可将南蒂罗尔方言语音转录为标准德语。 文件详解 文件名称: augusta_data-main.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • Speech_To_Docker_Based_语音转Docker指令音频完整数据

    2025年12月21日 30 80 14

    数据集概述 该数据集包含12名受试者(4名女性和8名男性)朗读“text-to-docker”数据集测试样本提示词的英文语音录音,共3192个音频文件,时长约3.92小时。数据采集遵循伦理规范,已获得受试者知情同意。 文件详解 数据压缩包: data.zip: ZIP格式压缩包,包含所有加密的音频文件,需通过decrypt.py脚本解密获取原始音频...
    packageimg
  • 英乌语言元音音素发音特征数据集

    2025年12月21日 30 173 54

    数据集概述 本数据集聚焦于英语和乌兹别克语两种语言的元音音素发音特征研究,包含一份以PDF格式呈现的相关文档,为语言语音学领域的发音特征分析提供资料支持。 文件详解 文件名称: Умаров Хамидилла Лутфуллаевич.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 瓦努阿图之声数据集2024

    2025年12月19日 30 186 85

    数据集概述 该数据集为“瓦努阿图之声”项目数据,核心包含与瓦努阿图相关的语音音频内容,以压缩包形式存储,未提供具体内容预览,整体结构简洁,无训练测试或原始处理数据的拆分。 文件详解 文件名称: lexibank/vanuatuvoices-v1.3.zip 文件格式: ZIP (.zip) 文件说明:...
    packageimg
  • 中国云南拉祜族黑拉祜语低音调代际差异数据集

    2025年12月19日 30 109 90

    数据集概述 本数据集为《中国云南拉祜族黑拉祜语低音调代际差异》研究的补充材料,包含黑拉祜语声调的声学测量数据、分析脚本及附录文档,支持语言声调变化的代际差异研究。 文件详解 附录文档: supplemental material appendices.pdf: PDF格式,包含研究相关的附录内容,如词汇表、图片书、交叉表、F0轨迹图和LME模型结果等。...
    packageimg
  • LJ语音_国际音标对齐转录数据集

    2025年12月11日 30 61 11

    数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
    packageimg
  • 俄语语音重音感知研究与语音识别技术应用

    2025年12月16日 30 116 56

    数据集概述 本数据集聚焦俄语语音重音感知问题,结合语音识别技术,分析俄语作为外语学习者的语音特点,通过神经网络算法识别其语音偏差,评估重音对沟通质量的影响,为俄语教学提供实践建议。 文件详解 文件名称: Turg’unboyev Abdullajon Abdubanno o’g’li.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 基于隐马尔可夫模型的语音特征提取数据集

    2025年12月14日 30 72 61

    数据集概述 该数据集围绕语音识别展开,提出结合隐马尔可夫模型(HMM)的混合语音识别模型,通过噪声去除、语音停顿检测、分帧加窗特征提取等阶段实现语音转文本,使用Praat工具实施,模型评估指标为F值(98%)和准确率(99%)。 文件详解 文件名称:Suppl File - Speech to Text - Latest.pdf 文件格式:PDF...
    packageimg
  • 圣维森特岛佛得角克里奥尔语数据集2019

    2025年12月13日 30 64 37

    数据集概述 本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。 文件详解 该数据集包含11个文件,按类型分类说明如下: - PDF文档类(共4个): -...
    packageimg
  • 法国朗伯德语音数据集

    2025年12月12日 30 99 53

    数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
    packageimg
  • 基于树莓派的安全语音识别服务开发文档

    2025年12月12日 30 78 66

    数据集概述 本数据集为一份关于在树莓派平台上开发安全语音识别服务的文档资料,包含相关技术实现的详细内容,为语音识别服务的开发与安全优化提供参考。 文件详解 文件名称: 53 7655.pdf 文件格式: PDF (.pdf) 文件内容: 文档类型文件,内容围绕在树莓派上开发安全语音识别服务展开,具体字段信息未提供。 适用场景 嵌入式系统开发研究:...
    packageimg
  • 同形异义词与同音异义词关联数据集

    2025年12月11日 30 169 54

    数据集概述 本数据集聚焦于同形异义词与同音异义词的关联研究,包含一份PDF格式的相关文档,为语言文字领域中词汇语义与语音关系的分析提供基础资料。 文件详解 文件名称: Jurayeva Zulayxo Shamsiddinovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • 英语音素范围_发音方式与发音部位探索数据集

    2025年12月10日 30 3 2

    数据集概述 本数据集聚焦英语语言中的音素,围绕发音方式与发音部位展开探索,通过单篇PDF文档呈现相关研究内容,为英语语音学领域的音素特征分析提供基础资料。 文件详解 文件名称:GaniyevaDildoraAzizovna.pdf 文件格式:PDF(.pdf) 文件内容:围绕英语音素的发音方式与发音部位主题展开的文档,具体内容需查阅PDF原文 适用场景...
    packageimg
  • 旁遮普方言语音数据集

    2025年12月9日 30 46 0

    数据集概述 本数据集包含旁遮普方言的语音录音数据,同时提供相关的模型代码文件,为旁遮普方言语音研究提供基础数据支持。 文件详解 文件名称: FemaleMale.html 文件格式: HTML (.html) 内容说明: 包含与旁遮普方言语音模型相关的代码 文件名称: Dataset.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
    packageimg