找到2个数据集

标签: 语料库对比分析

过滤结果
  • NUBUC_Based_语境控制口语故事语料库数据

    2026年1月31日 30 122 18

    数据集概述 本数据集为NyU-BU语境控制故事语料库(NUBUC),是兼顾自然性与实验可控性的口语语料库。包含8个独特故事的16段高质量录音,由男女演员各录制一遍,每故事含128句约2000词,围绕关键词构建,关键词在多语言维度匹配,语境参数(先验/局部语境强弱、句子位置早晚)被操控。 文件详解 文件名称:public.zip 文件格式:ZIP...
    packageimg
  • 古典与文学汉语学习者可靠词汇表原始频率数据集

    2025年12月16日 30 118 47

    数据集概述 该数据集包含古典与文学汉语学习者词汇表的原始频率计数,基于三个语料库(Micheal Loewe早期中文文本、正史、六部小说)构建,为汉语词汇研究提供基础数据支持。 文件详解 压缩包文件:...
    packageimg