社交媒体用户真实性判别数据集SocialMediaUserAuthenticityClassification-mohamedchouchaoui
数据来源:互联网公开数据
标签:社交媒体, 用户行为, 虚假账户, 真实性判别, 数据挖掘, 机器学习, 用户画像, 风险评估
数据概述:
该数据集包含来自社交媒体平台的公开用户资料,记录了用户的一系列特征,用于评估用户的真实性。主要特征如下:
时间跨度:数据未标明具体时间,可视为静态用户资料数据集使用。
地理范围:数据来源未明确,但可用于全球范围内的社交媒体用户真实性研究。
数据维度:数据集包含多个特征,如用户发布的帖子数量(pos)、关注者数量(flw)、标记数量(flg)、资料完整度(bl)、是否有头像(pic)、是否有链接(lin)、朋友数量(cl)、是否为认证用户(cz)、昵称是否包含数字(ni)、最近一次登录时间(erl)、最近一次评论时间(erc)、最后发布时间(lt)、话题参与度(hc)、是否为付费用户(pr)、关注用户的数量(fo)、国家编码(cs)、个人资料信息(pi)以及用户真实性标签(class,f代表虚假账户,其他值代表真实账户)。
数据格式:CSV格式,文件名为user_fake_authentic_2class.csv,便于数据分析和建模。
该数据集适合用于社交媒体用户行为分析、虚假账户检测以及用户真实性预测等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于社交网络分析、用户行为研究、欺诈检测等领域的学术研究,如虚假账户识别、用户画像构建等。
行业应用:为社交媒体平台、内容审核机构提供数据支持,用于提升用户真实性评估能力,打击虚假账户,净化平台环境。
决策支持:支持社交媒体平台的风险管理和内容安全策略制定,辅助平台进行用户行为监测与异常账户识别。
教育和培训:作为数据挖掘、机器学习等相关课程的实训数据,帮助学生和研究人员理解用户行为分析、真实性判别的相关技术。
此数据集特别适合用于探索社交媒体用户的行为特征与真实性之间的关系,帮助用户构建虚假账户检测模型,提升社交媒体平台的安全性和用户体验。