数据集概述
本数据集包含菲律宾十家报纸Facebook官方页面2015、2017及2019年的12,478条社交媒体评论,围绕摩洛身份、马马萨帕诺冲突、马拉维围城及BARMM建立等主题,可用于研究文本与报纸来源、地区及政治行政等变量的关系。
文件详解
- 数据文件:
- MMB151719SOCMED_v2.csv:CSV格式,包含评论核心数据,字段包括object_id(评论ID)、message(原始评论)、message_proc(预处理后评论)、lang_label(语言标签)、from_name(评论来源)、created_time(发布时间)、month_year(发布年月)、year(年份)、newspaper(报纸来源)、corpus(语料库类型)、administration(政治行政时期)、region(地区)、count(无空格字符串序列数)
- 说明文件:
- README.txt:TXT格式,包含数据集标题、生成者信息、联系方式等元数据
- 代码本文件:
- MMB151719SOCMED_codebook.pdf:PDF格式,解释CSV文件中变量及编码规则
适用场景
- 社交媒体文本分析:研究菲律宾南部冲突相关话题的公众讨论语义特征
- 语言多样性研究:分析多语言(他加禄语、宿务语、英语等)在冲突话题中的使用分布
- 媒体与政治关联研究:探索不同报纸来源、政治行政时期对评论内容的影响
- 地区差异分析:对比吕宋、维萨亚斯、棉兰老岛等地区的评论主题差异