马来西亚Instagram社交网络用户影响力最大化研究数据集-2020年4-5月
数据来源:互联网公开数据
标签:Instagram,社交网络,影响力最大化,用户行为,社交关系,马来西亚,传播模型,用户统计
数据概述:
本数据集是针对Instagram社交网络,用于影响力最大化(IM, Influence Maximization)任务而构建的。数据采集于2020年4月至5月,从马来西亚24所私立大学的Instagram用户及其关注者中获取,主要用户为马来西亚用户。数据集包含70,409个节点/用户,1,007,107条边/连接(关注者和被关注者)。
使用本数据集时,请引用以下论文:
作者:Kristo Radion Purba; David Asirvatham; Raja Kumar Murugesan
题目:基于Instagram参与度和活跃度的影响力最大化扩散模型
期刊:Journal of King Saud University - Computer and Information Sciences
年份:2020
链接:https://doi.org/10.1016/j.jksuci.2020.09.012
如有进一步问题,请联系:kristoradion@live.com
数据文件说明:
Instagram User Stats.csv:包含用户统计信息。
pos:发帖数量
flr:关注者数量
flg:关注数量
eg:参与度等级,一个1到12的量表,反映了相对于关注者数量的参与率强度(点击了解更多)
er:参与率,即点赞+评论/关注者
fg:一个月内关注者增长百分比
op:外部者百分比,即点赞帖子的非关注者数量除以所有点赞者的数量
Network for IC LT.txt:包含独立级联模型(IC, Independent Cascade)的社交网络数据。
source:源节点
target:目标节点
weight:权重(weight = 1/被关注者数量)
Network for IC-u LT-u.txt:包含改进的独立级联模型的社交网络数据。
source:源节点
target:目标节点
weight:权重(weight = 1/被关注者数量 * 源节点的EG * 目标节点的FG)
数据用途概述:
该数据集主要用于社交网络分析、影响力最大化研究、用户行为分析等。研究人员可以使用此数据构建和评估影响力传播模型,识别关键意见领袖,研究用户参与度和社交关系对信息传播的影响。此外,该数据集也适用于社交媒体营销、用户画像构建等应用场景。