找到2个数据集

标签: 语料库规模

过滤结果
  • CLS_INFRA_Based_基线方法学用户需求分析补充数据

    2026年1月28日 30 45 27

    数据集概述 本数据集为CLS INFRA框架下WP3的基线方法学用户需求分析补充数据,包含语料库元数据、格式/方法/工具分析结果等9个文件,覆盖全量与开放获取、CLS分类的语料库信息,支持自然语言处理领域的用户需求研究与语料库分析。 文件详解 说明文档类 文件名称:0_README.md 文件格式:MD 字段映射介绍:提供数据集开发背景(CLS...
    packageimg
  • Supplementary_material_5_Based_古东斯拉夫与现代斯拉夫语言距离测量实验结果数据

    2025年12月28日 30 2 0

    数据集概述 本数据集是基于语料库的语言距离测量实验结果,涵盖古东斯拉夫、现代东斯拉夫及现代标准斯拉夫语言变体。包含240个实验文件夹及1个汇总CSV文件,实验参数涉及主题反建模启发式、 Sørensen-Dice系数归一化、混合度量策略等,现代标准斯拉夫数据集还按不同规模占比(0.1、0.3、0.6、1)重复实验。 文件详解 汇总文件...
    packageimg