找到2个数据集

标签: 词汇简化

过滤结果
  • 加泰罗尼亚语和西班牙语词汇简化与复杂度预测数据集

    2025年12月13日 30 51 15

    数据集概述 本数据集包含加泰罗尼亚语和西班牙语的词汇简化与复杂度预测数据,是MLSP多语言词汇简化管道数据集的一部分,曾用于BEA教育应用NLP创新研讨会的MLSP共享任务,支持词汇复杂度评估与简化研究。 文件详解 加泰罗尼亚语测试数据压缩包:Catalan_Test.zip,ZIP格式,包含加泰罗尼亚语测试用词汇简化与复杂度预测数据...
    packageimg
  • 词汇简化可靠数据集BenchLS

    2025年12月8日 30 134 28

    数据集概述 该数据集为词汇简化研究提供可靠资源,整合LexMTurk与LSeval数据集的929个实例,每个实例包含句子、目标复杂词及按简单性排序的候选替换词。经拼写过滤和词形变化校正处理,平均每个复杂词对应7.37个候选词。 文件详解 文件名称:BenchLS.zip 文件格式:ZIP压缩包...
    packageimg