数据集

社交媒体推特机器人检测数据集SocialMediaTwitterBotDetection-csepython

数据来源：互联网公开数据

标签：推特数据, 机器人检测, 社交网络分析, 机器学习, 文本分析, 用户画像, 自动化账号, 数据挖掘

数据概述：该数据集包含来自推特（Twitter）平台的用户数据，记录了用于识别推特机器人账号的结构化用户属性。主要特征如下：时间跨度：数据未标明具体时间，可视为静态用户快照数据集使用。地理范围：数据未限定特定地理区域，涵盖了推特平台上的各类用户。数据维度：包括id（用户ID）、id_str（用户ID字符串）、screen_name（用户名）、location（用户所在地）、description（用户描述）、url（用户URL）、followers_count（关注者数量）、friends_count（关注数量）、listed_count（被列出次数）、created_at（账号创建时间）、favourites_count（收藏数量）、verified（是否认证）、statuses_count（状态数量）、lang（语言）、status（状态）、default_profile（是否默认模板）、default_profile_image（是否默认头像）、has_extended_profile（是否使用扩展资料）以及bot（是否为机器人，1代表是，0代表否）等字段，可用于多种机器学习任务。数据格式：CSV格式，文件名为bot_detection_data1.csv，便于数据分析和模型构建。来源信息：数据来源于推特平台公开数据，已进行结构化处理，并标注了机器人账号。该数据集适合用于社交网络分析、用户行为分析和机器人检测等领域的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于社交网络分析、机器学习和自然语言处理交叉领域的学术研究，如机器人账号识别、用户行为分析、社交网络结构分析等。行业应用：为社交媒体平台、网络安全公司等提供数据支持，尤其适用于自动化账号检测、恶意内容过滤、用户画像构建等。决策支持：支持社交媒体平台的风险控制、内容审核和用户管理，帮助平台维护健康的网络环境。教育和培训：作为数据科学、机器学习、社交网络分析等课程的实训数据，用于学生训练模型、理解社交媒体用户行为。此数据集特别适合用于探索推特用户行为特征，构建机器人账号识别模型，帮助用户提升对社交媒体平台的理解和风险管理能力。

数据与资源

versions_20250331165029.zipZIP
0.94 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.94 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

社交媒体推特机器人检测数据集SocialMediaTwitterBotDetection-csepython

数据与资源

附加信息

注册成功！