社交网络分类数据集
数据来源:互联网公开数据
标签:社交网络,图分类,机器学习,数据分析,数据挖掘,网络结构,用户行为,分类任务,网络分析,社交图谱
数据概述:
本数据集包含来自不同社交平台的用户网络数据,旨在支持社交网络分析和分类任务。数据集涵盖以下四个子集:
1. Deezer Ego Nets:2020年2月从音乐流媒体平台Deezer收集的东欧用户社交网络数据,节点代表用户,边代表相互关注关系,任务为预测用户性别。
2. Github Stargazers:截至2019年8月收集的GitHub用户社交网络数据,节点代表用户,边代表关注关系,任务为区分社交网络属于机器学习还是Web开发领域。
3. Reddit Threads:2018年5月从Reddit收集的讨论与非讨论主题帖数据,节点代表参与讨论的用户,边代表回复关系,任务为预测帖子是否为讨论帖。
4. Twitch Ego Nets:2018年4月从Twitch收集的用户社交网络数据,节点代表用户,边代表好友关系,任务为预测用户是否为多游戏玩家。
数据用途概述:
该数据集适用于社交网络分析、图分类任务、机器学习模型训练、社交行为研究等多个场景。研究人员可以利用数据集探索社交网络结构特征、用户行为模式及分类算法效果。企业可基于数据优化社交平台推荐算法,提升用户体验。教育机构则可将其用于教学,帮助学生理解社交网络分析方法及其实际应用。此外,数据集也支持跨领域研究,如用户行为预测、社交影响力分析等,为学术研究和工业应用提供有力支持。