评分网站争议性评论数据集
数据来源:互联网公开数据
标签:评分网站,用户评论,争议分析,电影,视频游戏,机器学习,数据清洗
数据概述:
本数据集收录了来自Metacritic和RottenTomatoes两个评分网站的用户评论数据,主要聚焦于引发争议的高知名度电影和视频游戏。数据涵盖2020年11月至2021年1月期间的用户评论,包括评分、评论内容及评论时间戳等关键字段。数据集包含以下内容:
1. 争议性评论目标:《复仇者联盟:终局之战》《星球大战:最后的绝地武士》《美国制裁》等引发广泛争议的电影及游戏评论。
2. 控制组样本:未受争议影响的高知名度作品评论,如《罗根》《星际穿越》等。
3. 数据清洗:保留了原始评论内容,包括可能包含的脏话和攻击性言论,未做人工修改。
数据用途概述:
该数据集适用于以下场景:
1. 争议性评论的识别与分类,如通过文本分析区分真实评论与被引导的“评分轰炸”评论。
2. 用户行为研究,探索争议性内容对用户评分行为的影响。
3. 机器学习模型开发,用于检测评论中的偏见或动机性言论。
4. 争议性内容的社会现象分析,研究文化、性别、种族等因素在评分争议中的作用。
5. 数据清洗与预处理方法研究,为后续机器学习任务提供高质量数据支持。
通过本数据集,研究者可深入分析评分争议背后的行为模式,为企业、开发者及政策制定者提供数据支持,帮助理解用户评分与产品评价之间的复杂关系。