EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据

数据集概述

本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。

文件详解

  • 文件名称:data.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含EN-MNE、EN-THA两个真实人类翻译语料库的句子对数据,句子对按长度(100-150字符)筛选,具体字段需参考文件内容,无公开预览信息。

适用场景

  • 机器翻译模型训练: 作为真实人类翻译语料,用于训练和优化EN-MNE、EN-THA语言方向的机器翻译模型。
  • 翻译质量评估: 基于真实人类翻译语料,对比分析机器翻译结果与人工翻译的差异,评估翻译质量。
  • 翻译方法论研究: 结合语料处理方法,探究特定长度句子对的翻译规律及处理策略。
  • 双语语料库构建: 补充EN-MNE、EN-THA语言对的真实翻译语料资源,支持相关语料库的扩展与完善。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.18 MiB
最后更新 2025年12月27日
创建于 2025年12月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。