网络社交平台用户真实与虚假账号识别数据集-2021-whoseaspects
数据来源:互联网公开数据
标签:用户分析,社交网络,数据分析,用户行为,虚假账号,真实账号,标签数据
数据概述:
本数据集包含从社交网络平台收集的真实与虚假用户账号信息,共20,000条记录。数据集旨在帮助识别和区分社交网络中的真实用户和虚假账号,通过分析用户的各种行为特征来判断账号的真实性。每个记录包含以下字段:
- Id: 用户ID
- Name: 用户的实名
- screen_name: 用户在社交网络上的显示名称
- favorite_no: 用户收藏的帖子数量
- statuses_count: 用户发布状态的次数
- followers_count: 用户的粉丝数量
- friends_count: 用户的好友数量
- favourites_count: 用户收藏的好友数量
- listed_count: 用户被列出的帖子数量
- created_at: 用户账号创建的日期和时间
- url: 用户的个人资料网址
- lang: 用户选择的语言
- time_zone: 用户所在的时区
- location: 用户账号创建时所在的地理位置
- default_profile: 用户是否使用默认个人资料信息(整数值)
- default_profile_image: 用户是否使用默认个人资料图片
- geo_enabled: 用户账号是否启用了地理位置功能
- profile_image_url: 用户个人资料图片的URL
- profile_banner_url: 用户个人资料横幅的HTTPS URL
- profile_use_background_image: 用户是否使用背景图片
- profile_background_image_url_https: 用户个人资料背景图片的HTTPS URL
- profile_text_color: 用户为个人资料信息选择的颜色代码
- profile_image_url_https: 用户个人资料图片的HTTPS URL
- profile_sidebar_border_color: 用户个人资料侧边栏边框的颜色代码
- profile_background_tile: 用户个人资料背景图片是否使用平铺
- profile_sidebar_fill_color: 用户个人资料侧边栏的颜色代码
- profile_background_image_url: 用户个人资料背景图片的当前URL
- profile_background_color: 用户个人资料背景的颜色代码
- profile_link_color: 用户个人资料链接的颜色代码
- utc_offset: 用户所在的UTC时间偏移量
- protected: 用户是否保护了其帖子
- verified: 用户账号是否经过验证
- description: 用户个人资料的简短描述
- updated: 用户个人资料最后更新的日期和时间
- Dataset: 标签字段,指示账号是真实(0)还是虚假(1)
数据用途概述:
该数据集适用于社交网络分析、虚假账号识别系统开发、用户行为研究等多种场景。研究者可以利用此数据集进行算法训练和验证,以提高虚假账号检测的准确率;社交平台可以利用该数据改进其账号审核机制,确保平台内容的准确性和可靠性;教育机构可以利用此数据集进行数据科学和机器学习课程的教学。数据集为科研人员和行业从业者提供了宝贵的数据资源,有助于提升对社交网络中虚假信息的识别能力。