数据2022年8月巴西亲博索纳罗Telegram群组消息数据集

数据集概述

该数据集包含2022年8月巴西总统竞选期间,25个亲博索纳罗公开Telegram群组中6802名用户发布的195567条消息ID,涵盖消息基础信息、分周词频统计等数据,为研究该时期相关网络讨论提供支持。

文件详解

  • 文档文件:
  • readme.pdf:PDF格式,包含数据集说明文档
  • groups_list.txt:TXT格式,记录25个亲博索纳罗Telegram群组的用户名(如OrdemDeCristo、Aliancapelobrasil38等)
  • 数据文件(CSV格式):
  • id_chats_agosto_telegram.csv:可能包含Telegram群组消息的ID与聊天关联数据
  • word_f_week1.csv、word_f_week2.csv、word_f_week3.csv、word_f_week4.csv:分周词频统计文件,字段为word(词汇)、n(出现次数),如“bolsonaro”“brasil”等词汇的周度出现频次
  • 代码文件:
  • msgs_from_username_and_id.py:PY格式,可能用于从用户名和ID获取消息的Python脚本

适用场景

  • 政治传播研究:分析2022年巴西总统竞选期间亲博索纳罗群组的网络讨论热点与传播趋势
  • 自然语言处理应用:基于分周词频数据开展文本分类、主题建模等NLP任务
  • 社交媒体行为分析:探究亲博索纳罗用户在Telegram平台的信息发布规律与互动特征
  • 选举舆情监测:研究特定政治群体在竞选关键时期的舆论倾向与关注焦点
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.89 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。