找到2个数据集

标签: LREC2022

过滤结果
  • IMTVault_Based_低资源语言语际标注文本提取与富集数据集_2022

    2026年1月19日 30 77 52

    数据集概述 本数据集为IMTVault,主要内容是从语法描述和类型学调查文章中提取并富集的低资源语言语际标注文本。数据集由1个压缩文件构成,无训练测试、数据标签或原始处理数据的拆分,适用于低资源语言的语言学研究与资源开发。 文件详解 文件名称:cldf-datasets/imtvault-v1.2.zip 文件格式:ZIP...
    packageimg
  • 佛教梵语嵌入模型评估数据集

    2025年12月4日 30 122 92

    数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...
    packageimg