朴素贝叶斯情感分类器生成数据集2023

数据集概述

本数据集是通过朴素贝叶斯分类器算法运行生成的情感分析相关数据,包含词汇表中的单词及其出现次数、似然比等统计信息,以及对应的可视化图表,为情感分类模型的词汇特征分析提供支持。

文件详解

  • 词汇统计文件(CSV格式):
  • vocab_statistics_small_20230511-171418.csv:小型词汇统计数据文件,包含字段Word(单词)、Occurrences(出现次数)、Likelihood Ratio(似然比)
  • vocab_statistics_large_20230511-171600.csv:大型词汇统计数据文件,包含字段Word(单词)、Occurrences(出现次数)、Likelihood Ratio(似然比)
  • 似然比图表文件(PNG格式):
  • Likelihood_ratio_graph_large_20230511-171600.png:基于大型数据集生成的似然比可视化图表
  • Likelihood_ratio_graph_small_20230511-171418.png:基于小型数据集生成的似然比可视化图表

数据来源

Cornell的Polarity Review v2.0数据集、Stanford的Large Movie Review Dataset

适用场景

  • 情感分析模型优化:分析词汇似然比对情感分类结果的影响
  • 自然语言处理研究:探究不同规模数据集下词汇特征的分布规律
  • 文本情感特征可视化:通过图表直观展示词汇似然比的分布情况
  • 朴素贝叶斯算法应用:验证算法在情感分类任务中的词汇处理效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 14.6 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。