找到27个数据集

标签: 翻译质量评估

过滤结果
  • GPT_4_Turbo_沙特法律文件翻译数据

    2026年2月1日 30 165 164

    数据集概述 本数据集包含由GPT-4 Turbo翻译的14份沙特阿拉伯法律文件,均为Excel格式。涵盖基础治理法、司法法、诉讼程序法、专利法等多个法律领域,无目录结构,文件直接存储,未提供训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称与格式:14个文件均为.xlsx格式,包括《Basic Law of...
    packageimg
  • AI4D_Based法语至丰贝埃维神经机器翻译平行文本数据集

    2026年1月29日 30 70 19

    数据集概述 本数据集是面向神经机器翻译任务的多语言平行文本集合,包含从法语到丰贝语(多哥语言)、法语到埃维语(贝宁语言)的平行句子对,总计七万余条标注数据,适用于机器翻译和句子分类任务,由AI4D倡议贡献。 文件详解 文件名称:French_to_fongbe.csv 文件格式:CSV...
    packageimg
  • MUST_LT_Based_学生翻译评估语料库数据_2023版

    2026年1月28日 30 210 185

    数据集概述 本数据集包含MUST-LT语料库中的学生翻译评估数据,用于搭配翻译研究。数据源自Vaičenonienė, J. 2023年关于MUST-LT学习者翻译语料库的搭配翻译案例分析研究,为翻译教学与研究提供实证数据支持。 文件详解 文件名称:MUST-LT studentų vertimai.docx 文件格式:DOCX...
    packageimg
  • 数据2024_MT_LLM_英到斯洛文尼亚语翻译质量评估数据集

    2026年1月28日 30 193 79

    数据集概述 本数据集为大语言模型(LLM)与传统神经机器翻译(NMT)的评估任务制备,包含7个系统(3个MT系统、4个LLM AI助手)的英到斯洛文尼亚语翻译结果,原始源文本与翻译同步采集以避免数据泄漏。 文件详解 翻译评估表格文件...
    packageimg
  • ICSE_MET_18_机器翻译服务元测试数据集_Version2_0

    2026年1月26日 30 4 1

    数据集概述 本数据集为机器翻译服务的元测试研究提供原始数据,采用空格分隔所有语言的单词(部分亚洲语言可能需字符级分析),包含ICSE MET '18会议相关的实验数据,用于评估机器翻译服务的元测试方法有效性。 文件详解 文件名称:Dataset for---A Monte Carlo Method for Metamorphic Testing of...
    packageimg
  • TradutorNós_Based_加利西亚语EMP多词表达自动翻译评估数据

    2026年1月20日 30 161 27

    数据集概述 本数据集用于评估TradutorNós翻译工具对加利西亚语多词表达(EMP)的翻译精度,包含加利西亚语到英语、西班牙语的翻译内容,仅含一个文件,便于快速获取和使用。 文件详解 文件名称:Conjunto de datos de traducción automática de la EMP en gallego con...
    packageimg
  • MeSDiCon_Based_西班牙语医学疾病症状候选名称词汇集_未过滤初始版

    2026年1月19日 30 76 38

    数据集概述 本数据集为MeSDiCon(西班牙语医学疾病与症状名称词汇集)的未过滤初始版本,包含西班牙语临床文本中提及的疾病和症状候选名称列表。数据通过自动识别、翻译及临床语料匹配生成,每条记录关联目标术语命名空间(MeSH或OMIM)及对应标识符,提供术语在2000万份西班牙语临床笔记中的出现频率和文档频率。 文件详解...
    packageimg
  • 商务汉语阅读文本_DeepL与Google_Translate翻译准确性对比分析数据

    2026年1月18日 30 161 9

    数据集概述 本数据集围绕商务汉语初级阅读文本展开,对比DeepL与Google Translate两款工具的翻译准确性,包含一份记录翻译结果对比的表格文档,用于分析不同机器翻译工具在商务汉语场景下的性能差异。 文件详解 文件名称:Data Tabel Hasil Perbandingan Penerjemahan.docx 文件格式:DOCX...
    packageimg
  • Monte_Carlo_Method_Based_机器翻译服务元测试蒙特卡洛方法伴随数据集

    2026年1月13日 30 136 73

    数据集概述 本数据集是“机器翻译服务元测试蒙特卡洛方法”的伴随数据,基于原始数据集优化分析方法,针对中文、日文等亚洲语言采用字符级分割,重新计算BLEU和余弦相似度得分,提供更精准的机器翻译服务测试评估数据。 文件详解 文件名称:Dataset Part II.xlsx 文件格式:XLSX...
    packageimg
  • EAMT2024_Pre_task_perceptions_机器翻译预任务感知与译员表现研究数据2024

    2026年1月1日 30 152 29

    数据集概述 本数据集包含EAMT2024论文研究中收集的全部数据,涉及为期两周的纵向研究,记录了十一名译员的源文本、译后编辑译文、质量及生产率评分,以及译员的预任务感知数据,用于分析机器翻译对翻译质量和效率的影响及人机交互优化方向。 文件详解 文件名称:Pre-task perceptions dataset.xlsx 文件格式:XLSX...
    packageimg
  • EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据

    2025年12月27日 30 89 12

    数据集概述 本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。 文件详解 文件名称:data.xlsx 文件格式:XLSX 字段映射介绍:包含EN-MNE、EN-...
    packageimg
  • 多模型方言法律文档翻译框架调查结果数据集

    2025年12月23日 30 60 9

    数据集概述 本数据集包含针对多模型方言法律文档翻译框架(MM-LDTF)的调查结果,涉及不同翻译系统对法律判决文档的翻译质量评估,涵盖评分表、评估说明、原始与翻译文本、调查结果数据及可视化代码等内容。 文件详解 Scoresheet.docx:Word文档,可能记录不同翻译系统的评分结果 Instructions for...
    packageimg
  • IN02004昌古纳拉扬石柱碑刻基座铭文译文

    2025年12月20日 30 179 170

    数据集概述 该数据集包含IN02004昌古纳拉扬石柱碑刻基座铭文的译文资料,以文档形式呈现,为研究该历史铭文内容提供直接的文本参考。 文件详解 文件名称:IN02004 Changu Narayana Base of Pillar Inscription (translation).docx 文件格式:DOCX...
    packageimg
  • BOBURNOMA翻译中的语言问题数据集

    2025年12月19日 30 4 3

    数据集概述 该数据集聚焦于"BOBURNOMA"翻译过程中出现的语言问题,包含一份相关的PDF文档,为研究翻译语言现象提供基础资料。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Sayyora Shodmonova .pdf - 文件格式: PDF (.pdf) - 内容说明:...
    packageimg
  • Umsuka英语_祖鲁语平行语料库

    2025年12月8日 30 135 122

    数据集概述 该数据集是开源高质量英语-祖鲁语平行语料库,涵盖南非本土及国际英语语境,由专业译者翻译构建。包含10000组平行句对(各5000组双向翻译),并从每组中分离1000组作为评估集,祖鲁语评估集经双重翻译以计算人类水平BLEU分数。 文件详解 训练数据文件(CSV格式): zu-en.training.csv:祖鲁语-...
    packageimg
  • IN02012_昌古纳拉扬神像基座铭文_译文

    2025年12月14日 30 184 88

    数据集概述 本数据集包含IN02012昌古纳拉扬神像基座铭文的译文资料,以文档形式呈现铭文内容,为研究该铭文的文字内容、历史背景及文化意义提供文本支持。 文件详解 文件名称:IN02012 XVII Effigy base Inscription of Changu.pdf 文件格式:PDF 内容说明:昌古纳拉扬神像基座铭文的PDF格式译文文档...
    packageimg
  • 开罗巴什蒂勒区萨米尔录音描述与评论的阿拉伯语及法语转录文本20120928

    2025年12月14日 30 40 18

    数据集概述 本数据集包含2012年9月28日埃及开罗巴什蒂勒区居民萨米尔,在收听自身录制的城市声音路线后,对录音内容的描述与评论的转录文本,涵盖阿拉伯语原文及法语译文。 文件详解 文件名称:Arabic transcript of description and comments Samir...
    packageimg
  • 从文化到语境_习语翻译的挑战文献

    2025年12月7日 30 43 31

    数据集概述 本数据集包含一篇围绕“习语翻译”主题的PDF文献,核心探讨从文化视角到语境分析的习语翻译挑战,为翻译理论研究及实践应用提供参考资料。 文件详解 文件名称: Abiyatova Muslima Maratovna .pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 阿卜杜拉_卡迪里小说_逝去的岁月_英译本研究文献

    2025年12月5日 30 10 8

    数据集概述 该数据集聚焦阿卜杜拉·卡迪里小说《逝去的岁月》英译本研究,收录相关学术文献,分析研究者对不同译本的比较观点,重点探讨翻译中历史真实性的保留问题。 文件详解 文件名称: Khamdamov Oybek Abdulkhayevich.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 翻译质量评估数据集QuACE数据集-emam2002

    2025年5月28日 30 191 80

    翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced...
    packageimg