Memecry_Based_4chan_pol_模因公式重复变异追踪数据

数据集概述

本数据集为论文“Memecry: Tracing the Repetition-with-Variation of Formulas on 4chan/pol/”的分析基础数据,包含4chan/pol/板块中模因公式(如“gr8 b8 m8”“orange man bad”)的相关数据,涉及种子词列表、共词网络、三元组模因数据及提取的模因公式清单,可用于研究模因的重复与变异特征。

文件详解

  • seedwords.csv
  • 文件格式:CSV
  • 字段映射介绍:包含用于筛选4chan/pol/帖子中 vernacular 的种子词列表,字段有word(原词)、stemmed_word(词干化词)、source(来源)
  • seedword-network_x.gdf/gephi
  • 文件格式:GDF、GEPHI
  • 字段映射介绍:包含含种子词的/pol/帖子的NPMI加权共词网络数据,文件名含年份(如2015、2016)
  • twoflow-data_x.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含/pol/常见三元组模因数据,字段有每年提及该三元组的帖子绝对数量、三元组词的年度平均NPMI得分、年度平均NPMI高于0.18的Top共现词
  • triplets.csv
  • 文件格式:CSV
  • 字段映射介绍:包含提取的模因三元组清单,字段有formula(模因公式)、query terms(查询词)、explanation(解释)、total posts(总帖子数)、average npmi(平均NPMI)

数据来源

论文“Memecry: Tracing the Repetition-with-Variation of Formulas on 4chan/pol/”

适用场景

  • 网络模因传播研究:分析4chan/pol/板块中模因公式的重复与变异规律
  • 共词网络分析:通过NPMI加权共词网络数据研究模因相关词汇的关联特征
  • 模因流行度追踪:利用三元组模因的年度帖子数量数据,追踪特定模因的时间分布特征
  • 网络社区文化研究:基于模因公式的解释及使用场景,探究4chan/pol/板块的社区文化与话语特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.9 MiB
最后更新 2026年1月21日
创建于 2026年1月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。