数据集概述
本数据集为孟加拉语PROSHNO BINNASH(问题分类)数据集,主要用于支持孟加拉语的多标签问题分类和问答任务。数据集包含两个Excel文件,分别存储原始孟加拉语问题及其英文翻译版本,为自然语言处理研究提供结构化的孟加拉语问题标注数据。
文件详解
- 原始孟加拉语问题文件
- 文件名称:
PROSHNO BINNASH/Proshno_ Binnash.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含原始的孟加拉语问题文本及其对应的多标签分类信息
- 英文翻译版本文件
- 文件名称:
PROSHNO BINNASH/Proshno Binnash_Englisg_Translated/Proshno Binnash_English_Translated.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含孟加拉语问题的英文翻译版本,便于跨语言研究和分析
适用场景
- 孟加拉语自然语言处理: 用于训练和评估孟加拉语文本分类模型,特别是多标签问题分类任务
- 跨语言问答研究: 通过中英文翻译版本支持多语言问答系统的开发和比较研究
- 教育技术应用: 为孟加拉语教育平台的智能问答系统提供数据支持
- 多标签分类算法验证: 测试和验证各种多标签分类算法在孟加拉语文本上的性能表现
- 语言资源建设: 丰富孟加拉语自然语言处理研究的数据资源库