IMDB_Based_50K电影评论情感分类数据集

数据集概述

本数据集为IMDB大型电影评论数据集,包含五万条用于自然语言处理或文本分析的电影评论,用于二元情感分类任务。其中训练集和测试集各两万五千条高极性评论,可通过分类或深度学习算法预测正负评论数量。

文件详解

  • 文件名称:IMDB Dataset.csv
  • 文件格式:CSV
  • 字段映射介绍:包含两个字段,review(电影评论文本)、sentiment(情感标签)
  • 文件名称:large_movie_review_dataset.zip
  • 文件格式:ZIP
  • 内容说明:数据集压缩包,包含完整的电影评论数据文件

数据来源

http://ai.stanford.edu/~amaas/data/sentiment/

适用场景

  • 自然语言处理情感分类: 用于训练和测试二元情感分类模型,预测电影评论的正负情感倾向
  • 文本分析算法研究: 比较不同分类或深度学习算法在情感分析任务中的性能表现
  • 深度学习模型训练: 作为大规模文本数据,支持深度学习模型(如LSTM、BERT)的训练与优化
  • 情感分析基准测试: 作为标准数据集,评估情感分析系统的准确性和泛化能力
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 104.36 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。