欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语

欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据

数据概述: ELRC-Medical-V2数据集是一个由欧盟委员会资助,德国人工智能研究中心协调的平行语料库,专门用于神经机器翻译研究。该数据集包含了医疗健康领域的文本,其中提供了英语和葡萄牙语的平行语料,方便研究人员进行跨语言的机器翻译模型训练和评估。

数据用途概述: 该数据集主要用于机器翻译模型的训练和评估,特别是在医疗健康领域。 研究人员可以利用该数据集开发和改进英葡双语的机器翻译系统, 也可以用于其他相关的自然语言处理任务,如跨语言信息检索、文本摘要等。该数据集对于推动医疗健康领域的多语言信息交流和知识共享具有重要意义。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 14:59 (UTC)
创建于 四月 14, 2025, 14:59 (UTC)