找到53个数据集

标签: 词频统计

过滤结果
  • 亚马逊商品评论情感分析预处理数据集

    2026年3月9日 30 14 0

    亚马逊商品评论情感分析预处理数据集_Amazon_Product_Reviews_Sentiment_Analysis_Preprocessing_Dataset 数据来源:互联网公开数据 标签:亚马逊评论, 情感分析, 文本预处理, 词频统计, 自然语言处理, 停用词, 词向量, 数据清洗 数据概述:...
    packageimg
  • 文本主题建模测试数据集

    2026年2月21日 30 65 48

    文本主题建模测试数据集_Text_Topic_Modeling_Test_Data 数据来源:互联网公开数据 标签:文本分析, 主题建模, 词频统计, TF-IDF, 数据预处理, 机器学习, 文本挖掘, 自然语言处理 数据概述: 该数据集包含预处理后的文本数据,主要用于测试主题建模算法的性能。主要特征如下:...
    packageimg
  • BMSatire_Based语料库语言学分析数据_附文档

    2026年1月30日 30 37 16

    数据集概述 本数据集包含BMSatire Descriptions语料库的分析数据及相关文档,属于英国学术院资助项目“Curatorial Voice: legacy descriptions of art objects and their contemporary uses”的成果。语料库源自M. Dorothy...
    packageimg
  • 德国道路交通法规_StVO_自动驾驶定性分析数据集

    2025年12月20日 30 163 36

    数据集概述 该数据集围绕德国道路交通法规(StVO)展开,通过定性分析探究其对自动驾驶的适用性。包含法规文本处理、分析脚本及结果文件,为研究自动驾驶与现有交通法规的适配性提供数据支持。 文件详解 README.md: Markdown格式文档,说明数据集内容,包含定量分析目录下的文本文件、Python分析脚本及CSV结果文件等信息。...
    packageimg
  • 硕士论文专家访谈转录数据集

    2025年12月19日 30 21 8

    数据集概述 该数据集包含六份专家访谈的转录文本,是硕士论文研究的基础资料。所有文件均为PDF格式,直接记录访谈内容,未进行训练测试或数据标签等预处理划分。 文件详解 核心文件: ZT1_Interviewpartner 1.pdf: PDF格式,第一份专家访谈转录文本 ZT2_Interviewpartner 2.pdf:...
    packageimg
  • 数据2022年8月巴西亲博索纳罗Telegram群组消息数据集

    2025年12月15日 30 132 109

    数据集概述 该数据集包含2022年8月巴西总统竞选期间,25个亲博索纳罗公开Telegram群组中6802名用户发布的195567条消息ID,涵盖消息基础信息、分周词频统计等数据,为研究该时期相关网络讨论提供支持。 文件详解 文档文件: readme.pdf:PDF格式,包含数据集说明文档...
    packageimg
  • Goodreads网站励志名言数据集

    2025年12月15日 30 78 55

    数据集概述 该数据集是从Goodreads网站收集的励志名言集合,包含1个压缩文件,未进行训练/测试、数据/标签等拆分,主要文件类型为ZIP格式,未提供内容预览或说明文档。 文件详解 文件名称: Goodreads Quotes.zip 文件格式: ZIP(压缩文件格式) 内容说明:...
    packageimg
  • Zipf变换与词频分析教学数据集_是_首相

    2025年12月9日 30 106 93

    数据集概述 本数据集是《应用科学计量学与信息科学II:知识表示》课程中Zipf变换与词频分析任务的配套教学材料,基于《Yes Prime Minister》(捷克译名《Jistě, pane premiére》)文本构建,包含数据文件与可视化图表。 文件详解 数据文件:...
    packageimg
  • 电商商品关键词重要性分析数据集

    2025年7月22日 30 36 27

    电商商品关键词重要性分析数据集_E_commerce_Product_Keyword_Importance_Analysis 数据来源:互联网公开数据 标签:电商, 关键词分析, 商品推荐, 文本挖掘, 机器学习, 特征重要性, 词频统计, 数据分析 数据概述:...
    packageimg
  • 图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46

    2025年5月30日 30 176 97

    图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46 数据来源:互联网公开数据 标签:图像描述, 词频统计, 文本分析, 自然语言处理, 计算机视觉, 语料库, 数据挖掘, 图像检索 数据概述:...
    packageimg
  • 文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar

    2025年5月30日 30 47 22

    文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:...
    packageimg
  • 文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138

    2025年5月29日 30 165 19

    文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138 数据来源:互联网公开数据 标签:主题建模, 文本分析, 动态主题, 时间序列分析, 词频统计, 文本挖掘, 自然语言处理, 数据可视化 数据概述: 该数据集包含从未知来源收集的文本数据,并经过处理,用于研究文本主题随时间的变化。主要特征如下:...
    packageimg
  • 英国经济战略政策文件词频数据集-adammuhtar

    2025年5月29日 30 52 21

    英国经济战略政策文件词频数据集-adammuhtar 数据来源:互联网公开数据 标签:经济政策,文本分析,词频统计,英国,政策文件,自然语言处理,文本挖掘,经济学,数据集 数据概述: 该数据集包含来自英国政府经济战略政策文件的词频统计数据,旨在分析和研究英国经济政策的语言特征和主题分布。主要特征如下:...
    packageimg
  • 文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal

    2025年5月28日 30 36 6

    文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,词频统计,向量化,机器学习,数据挖掘,文本分类 数据概述: 该数据集包含经过预处理的文本数据,用于文本数据的统计分析和向量化表示。主要特征如下: 时间跨度:...
    packageimg
  • 维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044

    2025年5月28日 30 101 49

    维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044 数据来源:互联网公开数据 标签:文本分析,词频统计,数据集,自然语言处理,语言研究,机器学习,词汇学,大数据 数据概述: 该数据集包含来自维基百科的文本数据,记录了维基百科中各词语的出现频率。主要特征如下:...
    packageimg
  • 能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller

    2025年5月21日 30 67 13

    能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 能源行业, Enron, 语料库, 自然语言处理, 词频统计, 信息检索 数据概述: 该数据集包含来自 Enron...
    packageimg
  • 电子邮件内容分析数据集EmailContentAnalysisDataset-yasinmillers

    2025年5月18日 30 85 37

    电子邮件内容分析数据集EmailContentAnalysisDataset-yasinmillers 数据来源:互联网公开数据 标签:电子邮件, 文本分析, Enron数据集, 自然语言处理, 词频统计, 信息检索, 语料库, 情感分析 数据概述:...
    packageimg
  • Enron电子邮件语料库词频统计数据集EnronEmailCorpusWordFrequencyStatistics-abdelrahmantamer11

    2025年5月18日 30 116 100

    Enron电子邮件语料库词频统计数据集EnronEmailCorpusWordFrequencyStatistics-abdelrahmantamer11 数据来源:互联网公开数据 标签:文本分析, 电子邮件, 词频统计, 自然语言处理, Enron, 语料库, 文本挖掘, 统计分析 数据概述:...
    packageimg
  • 能源行业电子邮件分析数据集EnergyIndustryEmailAnalysis-seminursimsek

    2025年5月18日 30 200 129

    能源行业电子邮件分析数据集EnergyIndustryEmailAnalysis-seminursimsek 数据来源:互联网公开数据 标签:电子邮件, 文本分析, Enron, 能源行业, 语料库, 词频统计, 自然语言处理, 信息检索 数据概述: 该数据集包含来自 Enron 公司内部的电子邮件数据,记录了 Enron...
    packageimg
  • 阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21

    2025年5月15日 30 123 63

    阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21 数据来源:互联网公开数据 标签:阿拉伯语, 词频统计, 自然语言处理, 文本分析, 语言学, 数据挖掘, 情感分析, 文本预处理 数据概述: 该数据集包含来自阿拉伯语文本的数据,记录了阿拉伯语单词及其出现频率。主要特征如下:...
    packageimg