孟加拉地区语音数据集_RBVD

数据集概述

本数据集通过面对面录音采集了孟加拉国八个地区的语音样本,包含不同地区的孟加拉语发音变体。每个地区对应一个文件夹,朗布尔地区分男女两个子文件夹,共1067个样本,支持孟加拉语方言多样性研究与语音技术开发。

文件详解

  • 核心压缩文件: RBVD Regional Bangla Voice Dataset.zip(ZIP格式)
  • 内部结构: 按地区划分的9个文件夹(朗布尔含男女两个子文件夹)
  • 地区样本详情:
  • 吉大港: 119句,16196 kB,时长421秒
  • 巴里萨尔: 119句,14706 kB,时长378秒
  • 朗布尔(男): 119句,12661 kB,时长378秒;朗布尔(女): 118句,8520 kB,时长263秒
  • 诺阿卡利: 119句,10048 kB,时长274秒
  • 迈门辛: 117句,12296 kB,时长389秒
  • 坦盖尔: 119句,11862 kB,时长304秒
  • 贾马尔普尔: 119句,9790 kB,时长308秒
  • 纳托尔: 118句,10627 kB,时长331秒

适用场景

  • 孟加拉语方言语音识别模型训练与优化
  • 区域语音变体的语言学特征分析
  • 方言保护与文化遗产数字化研究
  • 多区域语音助手的本地化开发
  • 口音分类与说话人识别技术研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 99.01 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。