-
Amazon_MT_Based手机多语言评论数据
2026年2月9日 30 139 106
数据集概述 本数据集包含亚马逊平台上的手机评论数据,涵盖英语、希腊语和意大利语三种语言,其中非英语评论为机器翻译版本。数据集以单一压缩文件形式呈现,未划分训练/测试集、数据/标签集或原始/处理集,可用于多语言文本分析及电商评论研究。 文件详解 文件名称:ACPMR.zip 文件格式:ZIP...
-
OJ_Samples_翻译结果与评估数据集
2026年2月2日 30 19 4
数据集概述 本数据集开源了小规模OJ样本及其翻译结果与评估结果,为相关实验提供基础数据支撑。数据集包含1个压缩文件,未划分训练测试集、数据标签集或原始处理集,具体内容可参考README.md。 文件详解 文件名称:oj_samples.zip 文件格式:ZIP...
-
ZENODO人工智能智能体机器翻译人类评价数据集2025
2026年1月30日 30 124 95
数据集概述 本数据集为论文《Are AI agents the new machine translation frontier?》配套的人类评估数据,聚焦AI智能体(单智能体与多智能体系统)在机器翻译领域的应用潜力,包含针对其翻译质量的人工评估结果,是研究AI智能体机器翻译性能的关键支撑数据。 文件详解 文件名称:AI agents paper -...
-
南非语言嵌入评估数据集_Simlex_和_WordSim
2026年1月30日 30 62 54
数据集概述 本数据集包含针对南非语言(塞茨瓦纳语、塞佩迪语)的Simlex和WordSim评估数据,通过人工标注的单词对相似度评分,用于衡量语义相关性。单词对由英文手动翻译而来,可用于计算模型向量余弦相似度与人类评分的相关性,评估语言模型性能。数据集共含4个文件。 文件详解 文件名称:SimLex-999-orig - Sepedi.xlsx...
-
数据85_Business_Word_中印尼商务词汇多平台翻译数据
2026年1月27日 30 76 22
数据集概述 本数据集包含85条商务相关中文词汇的印尼语翻译结果,通过Google Translate、Baidu Translate和DeepL三个翻译工具生成,为商务场景下的中印尼词汇翻译提供多平台对比参考,共含1个文件。 文件详解 文件名称:85 Chinese-Indonesian Business Word Translations.xlsx...
-
Deep_learning_Based_孟加拉语深度学习问答系统数据集
2026年1月26日 30 9 8
数据集概述 本数据集是论文《Deep learning based question answering system in Bengali》的配套数据,为SQuAD 2.0数据集的孟加拉语翻译版本,包含训练、验证及预处理翻译结果三类文件,共3个JSON格式文件,可用于孟加拉语问答系统的深度学习研究。 文件详解...
-
AVVQ_Thai_Based慢性静脉疾病患者问卷信效度研究完整数据
2026年1月23日 30 178 59
数据集概述 本数据集围绕泰国版阿伯丁静脉曲张问卷(AVVQ-Thai)展开,包含问卷反向翻译版本、COSMIN清单、泰文问卷附录及原始数据,用于研究该问卷在慢性静脉疾病患者中的信效度及最小临床重要差异,为量表临床应用提供支持。 文件详解 反向翻译版本文件 文件名称:Reverse-translated version.docx 文件格式:DOCX...
-
EAMT2024_Pre_task_perceptions_机器翻译预任务感知与译员表现研究数据2024
2026年1月1日 30 159 37
数据集概述 本数据集包含EAMT2024论文研究中收集的全部数据,涉及为期两周的纵向研究,记录了十一名译员的源文本、译后编辑译文、质量及生产率评分,以及译员的预任务感知数据,用于分析机器翻译对翻译质量和效率的影响及人机交互优化方向。 文件详解 文件名称:Pre-task perceptions dataset.xlsx 文件格式:XLSX...
-
EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据
2025年12月27日 30 200 74
数据集概述 本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。 文件详解 文件名称:data.xlsx 文件格式:XLSX 字段映射介绍:包含EN-MNE、EN-...
-
历史小说翻译问题及其解决对策文档
2025年12月19日 30 139 0
数据集概述 本数据集包含一份PDF文档,核心内容围绕历史小说翻译中存在的问题及对应的解决对策展开,为研究历史小说翻译实践提供参考资料。 文件详解 文件名称: Khamdamov Oybek Abdulkhayevich.pdf 文件格式: PDF (.pdf) 文件内容:...
-
BOBURNOMA翻译中的语言问题数据集
2025年12月19日 30 166 113
数据集概述 该数据集聚焦于"BOBURNOMA"翻译过程中出现的语言问题,包含一份相关的PDF文档,为研究翻译语言现象提供基础资料。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Sayyora Shodmonova .pdf - 文件格式: PDF (.pdf) - 内容说明:...
-
Umsuka英语_祖鲁语平行语料库
2025年12月8日 30 97 10
数据集概述 该数据集是开源高质量英语-祖鲁语平行语料库,涵盖南非本土及国际英语语境,由专业译者翻译构建。包含10000组平行句对(各5000组双向翻译),并从每组中分离1000组作为评估集,祖鲁语评估集经双重翻译以计算人类水平BLEU分数。 文件详解 训练数据文件(CSV格式): zu-en.training.csv:祖鲁语-...
-
开罗居民萨尔玛城市声音记录描述与评论的阿拉伯语及法语转录文本20120926
2025年12月10日 30 162 92
数据集概述 该数据集包含2012年9月26日,埃及开罗居民萨尔玛对其使用双耳麦克风记录的城市日常旅程声音的描述与评论的转录文本,涵盖原始阿拉伯语版本及法语翻译版本,为研究城市声音感知提供质性数据支持。 文件详解 阿拉伯语转录文件: Arabic transcript of description and comments Salma...
-
翻译工具局限性研究论文集
2025年12月9日 30 140 1
数据集概述 本数据集包含一篇关于翻译工具局限性的研究论文,核心围绕如何在突破计算机辅助翻译(CAT)工具限制的同时革新翻译技术展开,为相关领域研究提供参考资料。 文件详解 文件名称: Abiyatova Muslima Maratovna.pdf 文件格式: PDF (.pdf) 文件内容:...
-
越南语文本翻译质量评估数据集
2025年8月18日 30 40 30
越南语文本翻译质量评估数据集_Vietnamese_Text_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 越南语, 质量评估, 自然语言处理, 对比分析, 深度学习, 文本生成 数据概述: 该数据集包含越南语翻译文本及其参考译文,用于评估机器翻译模型的性能。主要特征如下:...
-
多语言维基百科文章翻译质量评估数据集
2025年8月11日 30 77 14
多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:...
-
机器翻译模型生成文本质量评估数据集
2025年8月3日 30 174 53
机器翻译模型生成文本质量评估数据集_Machine_Translation_Model_Text_Generation_Quality_Evaluation 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 文本评估, 对比分析, 自然语言处理, 语言模型, 文本质量, 评估指标 数据概述:...
-
多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoan...
2025年5月31日 30 66 36
多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoangthai1507 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 质量评估, 语料库, 翻译质量, 自然语言处理, 文本对齐, 深度学习 数据概述:...
-
Transformer模型翻译数据集iTransformerDataset-tylerfarnan
2025年5月29日 30 87 66
Transformer模型翻译数据集iTransformerDataset-tylerfarnan 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,Transformer,文本处理,语言模型,深度学习,翻译质量 数据概述:...
-
翻译质量评估数据集QuACE数据集-emam2002
2025年5月28日 30 30 0
翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced...



