数据集概述
本数据集名为IsamasRed,用于跟踪2023年8月1日至11月30日期间Reddit平台上关于以巴冲突的讨论内容。包含412,258条帖子和8,089,095条评论,记录了帖子、评论及对话的核心属性,如作者、时间戳、得分等,同时标注了对话涉及的相关话题倾向,为研究冲突相关社交讨论提供结构化数据支持。
文件详解
- 样本文件(Sample files)
- 文件名称:comments_sample.json、conversations_sample.json、submissions_sample.json
- 文件格式:JSON
- 字段映射介绍:
- comments_sample.json:包含评论的Subreddit、id、text、author、timestamp、submission_id、controversial、score、ups、downs、parent_id等属性
- submissions_sample.json:包含帖子的Subreddit、id、author、timestamp、title、text、score、upvote_ratio、upvotes等属性
- conversations_sample.json:包含对话的comments_df(所有评论信息)、freepalestine_islamophobia(话题标签0/1)、zionism_antisemitism(话题标签)等属性
- ID列表文件(ID list files)
- 文件名称:full_comments_ids.csv、full_submission_ids.csv
- 文件格式:CSV
- 字段映射介绍:均包含id字段,分别记录完整的评论ID列表和帖子ID列表
数据来源
GitHub仓库https://github.com/kaichen23/israel-hamas
适用场景
- 冲突话题社交讨论分析: 研究以巴冲突期间Reddit平台上用户讨论的内容倾向、参与度及传播特征
- 社交媒体话题标签识别: 利用对话中的话题标签字段,分析冲突相关子话题(如Free Palestine、Zionism等)的分布与关联
- 社交网络用户行为研究: 通过帖子和评论的作者、得分、争议性标签等属性,分析用户参与冲突讨论的行为模式
- 冲突舆情监测: 基于时间范围和内容数据,跟踪以巴冲突相关社交舆情的动态变化趋势