2020东京奥运会体操赛事推文数据集-2021年7月15日至8月14日-sinatavakoli
数据来源:互联网公开数据
标签:奥运会,体操,推文,社交媒体,情感分析,趋势分析,体育,Twitter,赛事,舆情
数据概述:
本数据集收录了2020年东京奥运会期间,关于体操赛事相关的推文数据,数据来源于Twitter。这些推文通过Twitter API采集,使用特定的体操相关关键词和标签,限定在特定时间范围内。
数据字段:
* 文本(Text):推文内容。
* 创建时间(Created At):推文发布的时间和日期。
* 实体(Entities):推文中提及的各种实体,如话题标签和注释。
* 编辑历史推文ID(Edit History Tweet IDs):与编辑历史相关的推文ID(如果可用)。
* 作者ID(Author ID):推文作者的唯一标识符。
* ID:推文的唯一标识符。
* 引用推文(Referenced Tweets):推文引用的其他推文ID(如果可用)。
* 内容隐藏(Withheld):关于被隐藏内容的信息(如果适用)。
数据量:
* 推文数量:16,671条
* 列数:8列
时间范围:
数据集涵盖了2021年7月15日至2021年8月14日的推文,与2020年奥运会的时间范围相吻合。
数据用途概述:
该数据集可用于多种用途,包括情感分析、趋势分析、了解公众反应以及与指定时间段内的体操赛事相关的社交媒体研究。
数据质量:
数据集经过一些预处理,以删除重复和不相关的推文。但是,它可能仍然包含一些噪声。数据以从Twitter收集时的原始状态呈现。
许可协议:
该数据集根据知识共享署名-相同方式共享许可协议发布。