巴西葡萄牙语与巴西手语标注平行语料库

数据集概述

该数据集包含127,349条巴西葡萄牙语与巴西手语(LIBRAS)标注的平行句子对,以CSV格式存储。核心为双语对齐内容,附加政府来源标识及葡萄牙语的英文自动翻译,支持手语处理与机器翻译研究。

文件详解

  • 文件名称:pt_br2libras_gloss.csv
  • 文件格式:CSV
  • 字段映射:
  • pt-br:巴西葡萄牙语原句
  • libras-gloss:对应的LIBRAS标注翻译
  • is_government_source:布尔值,标识句子是否来自巴西联邦政府官方网站
  • english_translation:巴西葡萄牙语句子的自动生成英文翻译(补充元数据)

适用场景

  • 双语语料库研究:分析巴西葡萄牙语与LIBRAS的语言对应关系
  • 机器翻译模型训练:开发葡萄牙语到LIBRAS的翻译系统
  • 手语处理应用:支持手语识别、合成等技术研发
  • 多语言资源建设:补充葡萄牙语与手语平行语料资源
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.41 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。