孟加拉语孤立语音数据集

数据集概述

该数据集包含孟加拉语孤立语音样本,涵盖34个孟加拉语单词和24个英语单词,由25名来自孟加拉国不同地区的人员录制,每个单词30个样本,总计1800个样本,用于语音识别相关研究。

文件详解

该数据集由两个压缩文件组成,具体说明如下: - 文件名称: Bangla Isolated Speech Dataset/Combined_dataset.rar - 文件格式: RAR压缩包 (.rar) - 内容说明: 包含所有语音样本的压缩文件 - 文件名称: Bangla Isolated Speech Dataset/Dataset_Training_Test_Splitted.rar - 文件格式: RAR压缩包 (.rar) - 内容说明: 已按训练集和测试集划分的压缩文件,训练样本为.wav格式,测试样本为.mp3格式,采样频率为四万四千一百赫兹

适用场景

  • 语音识别模型训练: 用于训练和测试孟加拉语孤立词语音识别系统
  • 多语言语音处理研究: 分析孟加拉语与英语语音特征差异
  • 语音样本库构建: 补充低资源语言的语音数据集
  • 语音转换技术开发: 探索不同格式(wav/mp3)语音样本的转换应用
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 148.45 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。