数据集概述
本数据集为Telegram平台虚假信息分析专用数据集,聚焦元数据同时保留隐私。包含3个文件,涉及参与者信息、帖子数据及说明文档,适用于社交媒体虚假信息传播路径、参与者行为等分析场景。
文件详解
- Readme.txt
- 文件格式:TXT
- 内容介绍:说明文件结构,包括collection_actors.csv记录每个参与者的通用信息(含唯一actor_id),collection_posts包含各参与者的帖子数据文件(以posts_{actor_id}.csv命名)。
- collection_actors_v2.0.csv
- 文件格式:CSV
- 字段映射:包含group、active、total_message_ids、missing_message_ids、max_participants、min_participants、mean_participants、latest_participants、days_online、real_avg_posts_per_day、content_post、original_post、anonymized_spr等字段,记录参与者的基础信息与行为统计。
- collection_posts_v2.0.zip
- 文件格式:ZIP
- 内容介绍:压缩包内包含各参与者的帖子数据文件,每个文件以posts_{actor_id}.csv命名,记录对应参与者的所有帖子信息。
适用场景
- 虚假信息传播路径分析: 通过参与者元数据与帖子数据,追踪Telegram平台虚假信息的传播节点与扩散模式。
- 社交媒体参与者行为研究: 基于参与者活跃度、发帖频率等字段,分析虚假信息传播中的用户行为特征。
- 隐私保护型元数据分析: 利用去标识化的元数据,开展合规的虚假信息检测算法训练。
- 社交媒体内容生态研究: 结合帖子数量、原创性等指标,分析Telegram平台的信息生产与传播生态。