找到5个数据集

标签: 高频词汇

过滤结果
  • NVivo_Based_文本词频分析与工具对比数据集

    2026年1月31日 30 79 1

    数据集概述 本数据集包含使用NVivo工具生成的文本词频搜索结果文件,以及一份对比AntConc与NVivo词频结果的电子表格,共5个文件。数据聚焦于文本词频分析,支持工具间的词频结果对比,适用于文本处理相关研究。 文件详解 文档文件(.docx格式,共3个) 文件名称:Word Freq-Stem All-min3 Alphabetical...
    packageimg
  • Top_100_collected_丹麦经典作家作品高频评论词汇数据

    2026年1月25日 30 91 70

    数据集概述 本数据集包含丹麦五部经典文学作品数字版本中评论最多的一百个词汇,涉及作家包括Georg Brandes、Grundtvig、Henrik Ibsen、Ludvig Holberg、Søren Kierkegaard和Zacharias Topelius。数据存储于单个Excel文件中,可用于分析丹麦文学作品的评论热点词汇及文本特征。...
    packageimg
  • 乌兹别克语停用词列表数据集

    2025年12月23日 30 129 36

    数据集概述 本数据集包含通过三种自动方法从乌兹别克语"学校语料库"生成的停用词列表,涵盖单字词、双字词及带搭配的双字词停用词,为乌兹别克语自然语言处理任务提供基础资源。 文件详解 压缩包文件: uzbek_stopwords.zip: ZIP格式压缩包,包含以下核心文件: stopwords_unigrams.txt:...
    packageimg
  • 印尼人权紧急状态推特标签推文数据集2020

    2025年12月14日 30 79 31

    数据集概述 本数据集是通过Twint工具采集的、包含2020年12月18日至19日期间,带#IndonesiaHumanRightsSOS标签的推特数据,共约十万六千九百零三条记录,涵盖用户ID、用户名、推文内容等基础信息,还附带词云、高频词等分析样例,为研究该标签相关讨论提供支持。 文件详解 原始数据文件:...
    packageimg
  • GRE高频词汇词表数据集GRE高频词汇词表数据集-sarthakvajpayee

    2025年4月23日 30 69 17

    GRE高频词汇词表数据集GRE高频词汇词表数据集-sarthakvajpayee 数据来源:互联网公开数据 标签:GRE词汇,高频词汇,词表,备考,语言学习,教育,考试,词汇记忆 数据概述:该数据集包含来自公开资源的GRE高频词汇词表,记录了大量在GRE考试中频繁出现的词汇及其相关含义和例句。主要特征如下:...
    packageimg