找到3个数据集

标签: 词汇简化

过滤结果
  • NNSeval_Based_非母语者词汇简化评估数据集

    2026年2月9日 30 31 23

    数据集概述 本数据集基于针对非母语者的词汇复杂度用户研究构建,包含400名非母语者对维基百科、LSeval和LexMTurk来源句子中内容词的理解度标注结果,经筛选优化后形成NNSeval数据集,可用于评估词汇简化系统对非母语者的适用性。 文件详解 文件名称:NNSeval.zip 文件格式:ZIP...
    packageimg
  • 加泰罗尼亚语和西班牙语词汇简化与复杂度预测数据集

    2025年12月13日 30 123 1

    数据集概述 本数据集包含加泰罗尼亚语和西班牙语的词汇简化与复杂度预测数据,是MLSP多语言词汇简化管道数据集的一部分,曾用于BEA教育应用NLP创新研讨会的MLSP共享任务,支持词汇复杂度评估与简化研究。 文件详解 加泰罗尼亚语测试数据压缩包:Catalan_Test.zip,ZIP格式,包含加泰罗尼亚语测试用词汇简化与复杂度预测数据...
    packageimg
  • 词汇简化可靠数据集BenchLS

    2025年12月8日 30 91 63

    数据集概述 该数据集为词汇简化研究提供可靠资源,整合LexMTurk与LSeval数据集的929个实例,每个实例包含句子、目标复杂词及按简单性排序的候选替换词。经拼写过滤和词形变化校正处理,平均每个复杂词对应7.37个候选词。 文件详解 文件名称:BenchLS.zip 文件格式:ZIP压缩包...
    packageimg