孟加拉语时态语料库

数据集概述

该数据集是一个全面的孟加拉语文本语料库,按现在时、过去时、将来时三类时态分类。包含13500个孟加拉语句子,三类时态句子数量分布均衡,覆盖当代语言使用场景,为孟加拉语时态相关研究提供数据支持。

文件详解

  • 文件名称: BengaliTenseCorpus.xlsx
  • 文件格式: XLSX (.xlsx)
  • 内容说明: 包含13500个孟加拉语句子,按时态分为三类:现在时(4550句,标签0)、过去时(4460句,标签1)、将来时(4490句,标签2),无训练/测试、数据/标签或原始/处理数据的拆分。

数据来源

公开可访问的孟加拉语博客、Facebook页面、杂志、书籍、新闻文章及部分自制数据

适用场景

  • 自然语言处理研究:用于孟加拉语时态识别模型的训练与验证
  • 计算语言学分析:探究孟加拉语时态表达的语法规则与使用特征
  • 语料库语言学研究:分析当代孟加拉语在不同时态下的文本分布与语言特点
  • 语言教育应用:为孟加拉语时态教学提供真实语料支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.21 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。