找到2个数据集

标签: 词级对齐

过滤结果
  • 基于卡巴耶扎尔托什语的三语铭文_词级对齐与命名实体开放数据

    2026年2月9日 30 14 1

    数据集概述 本数据集包含Ka'ba-ye Zartošt(ŠKZ)三语铭文的希腊语、中古波斯语、帕提亚语版本的句级与词级对齐语料,以及人工提取的命名实体。语料遵循Huyse(1999)的行编号,对齐由Ugarit工具生成,命名实体含近400个标注为人物、地点或地点衍生物的条目,部分关联维基数据。 文件详解 对齐语料文件 合并文件:alignment-...
    packageimg
  • Iliad_BookOne_多语言翻译词级对齐树库注释数据

    2026年1月30日 30 93 0

    数据集概述 本数据集包含《伊利亚特》第一卷的波斯语和库尔德语翻译文本,与树库进行词级对齐,并附有Didakta注释及双语词汇表。整合了UD树库和Perseus树库数据,支持古典文学翻译、多语言对齐及词汇研究,共含8个文件。 文件详解 翻译与树库对齐文件 文件名称:Iliad one Treebank (UD and Perseus) with...
    packageimg