nlp_text_sentence_Based_汉印尼复合句数据集

数据集概述

本数据集包含普通话与印尼语的复合句数据,核心内容围绕两种语言的复合句展开,为自然语言处理领域提供研究资源。数据集文件数量为1,无目录结构,主要文件格式为xlsx。

文件详解

  • 文件名称:Data Set of Compound Sentences in Mandarin and Indonesian.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:未提供具体字段信息,推测包含普通话和印尼语的复合句文本内容相关字段。

适用场景

  • 自然语言处理研究: 用于分析普通话与印尼语复合句的结构特征、语法规则等。
  • 机器翻译模型训练: 可作为双语复合句语料,辅助汉印尼机器翻译模型的训练与优化。
  • 语言对比分析: 支持两种语言复合句的语言学对比研究,探索语言间的异同点。
  • 语料库构建: 补充汉印尼双语语料库资源,丰富自然语言处理的基础数据。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。