-
金融新闻文本挖掘平行语料库数据集2007_2020
2025年12月15日 30 107 61
数据集概述 本数据集为金融领域的英汉平行新闻语料库,包含2007至2020年的60,473篇双语文档,涵盖新闻的标题、正文等核心内容,可用于金融领域的平行双语文本挖掘研究。 文件详解 文件名称:FT-en-zh.rar 文件格式:RAR压缩包...
-
ClinSpEn平行语料库_英语_西班牙语COVID_19临床病例_术语和本体概念数据集
2025年12月14日 30 104 36
数据集概述 该数据集为ClinSpEn平行语料库,包含英语-西班牙语COVID-19临床病例报告、临床术语及本体概念三类数据,由专业医学翻译人员翻译并经临床专家修订,适用于训练和评估临床机器翻译系统,还提供单语背景数据用于分析系统在未见过数据上的表现。 文件详解 文件名称: clinspen_corpora_complete.zip 文件格式:...



