找到5个数据集

分类: 公开数据 标签: 词汇频率

过滤结果
  • 古典与文学汉语学习者可靠词汇表原始频率数据集

    2025年12月16日 30 100 27

    数据集概述 该数据集包含古典与文学汉语学习者词汇表的原始频率计数,基于三个语料库(Micheal Loewe早期中文文本、正史、六部小说)构建,为汉语词汇研究提供基础数据支持。 文件详解 压缩包文件:...
    packageimg
  • 论证一词多义性与跨社区连接数据集

    2025年12月13日 30 39 4

    数据集概述 本数据集围绕“论证”一词的多义性展开,包含研究论文终稿及原始分析数据。核心内容为通过Scopus文献分析,揭示该词在不同学科、期刊和社区中的语义分层与共享机制,为理解科学语言如何促进跨领域合作提供数据支持。 文件详解 数据文件: word_frequencies.csv:...
    packageimg
  • 瑞士新冠疫情主流媒体词汇与命名实体分析数据集

    2025年12月12日 30 24 5

    数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
    packageimg
  • digital_词元在PD与TE项目中的分布数据集2016_2019_2021

    2025年12月4日 30 169 168

    数据集概述 该数据集记录了词元"digital"在PD与TE项目中2016、2019、2021年的分布情况,包含11个文件,以PDF格式为主,辅以Excel数据文件,为分析该词元在不同项目及年份的出现规律提供数据支持。 文件详解 PDF文档文件(共10个): 包含PCE 2021.pdf、PCE 2016.pdf、PD 2019.pdf、TE...
    packageimg
  • 阿拉伯语_英语双语者皮博迪词汇测试主观频率估计数据集

    2025年11月27日 30 69 54

    数据集概述 本数据集包含阿拉伯语-英语双语者对皮博迪词汇测试(PPVT)单词的主观频率估计数据,涉及词汇的语言形式、主观频率评分、词汇特征等信息,为双语词汇认知及心理语言学研究提供数据支持。 文件详解 文件名称: DATA_SET.sav 文件格式: SAV(SPSS数据格式) 字段映射:...
    packageimg