2020年知名媒体平台文章数据集-kaustubh18282
数据来源:互联网公开数据
标签:Medium,文章,数据分析,新闻,科技,教育,创业,博客,阅读时间,互动量
数据概述:
本数据集包含了2020年1月至8月期间在知名Medium平台上的文章详情。数据来源包括以下知名出版物:The Startup、Mission.org、Personal Growth、HackerNoon.com、Towards Data Science、Startup Grind、The Economist、The Coinbase Blog、Better Humans、UX Collective。数据集通过随机选定日期的方式进行采集,因此某些出版物的文章数量可能较多,而其他出版物的文章数量可能较少。
数据集包含以下字段:
- Title: 文章标题
- SubTitle: 文章副标题(如果存在,否则为nan)
- Link: 文章的链接/URL
- Claps: 文章获得的拍手数
- Reading_Time: 文章的阅读时间
- Responses: 文章收到的评论数量
- Publication: 发布文章的出版物名称
- Title_clean: 清理后的文章标题(去除不支持的字符)
- SubTitle_clean: 清理后的文章副标题(去除不支持的字符)
- Title_wc: 文章标题的字数
- SubTitle_wc: 文章副标题的字数
数据用途概述:
该数据集适用于多种分析和研究场景,包括但不限于文章传播分析、读者互动研究、内容质量评估、出版物影响力分析等。研究者可以利用此数据集探究不同出版物的文章特征,了解读者的行为模式,评估文章质量和影响力。此外,该数据集也为教育和培训提供了案例资源,帮助学习者理解内容创作和传播的基本规律。