印尼语_米南加保语平行语料库

数据集概述

该数据集为印尼语与米南加保语的平行语料库,包含对应语言的句子对,覆盖日常语言使用的多场景与主题,支持机器学习在语言翻译领域的应用,助力自然语言处理研究与翻译应用开发。

文件详解

该数据集由1个CSV文件组成,具体说明如下: - 文件名称: Parallel Corpus Indonesian-Minang/original data/Korpus Bahasa Indo Minang.csv - 文件格式: CSV (.csv) - 字段映射: - Kalimat Bahasa Indonesia: 印尼语句子 - Kalimat Bahasa Minangkabau: 米南加保语句子 - Revisi: 修订信息(部分记录为空)

适用场景

  • 机器翻译模型训练: 用于构建或优化印尼语与米南加保语之间的神经机器翻译系统
  • 自然语言处理研究: 支持双语词汇对齐、句法分析等基础语言研究
  • 语言资源开发: 为米南加保语等少数民族语言的数字化保护与资源建设提供数据基础
  • 跨语言对比分析: 探究印尼语与米南加保语在日常语境中的表达差异与语义对应关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.03 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。