TED演讲YouTube视频数据集
数据来源:互联网公开数据
标签:TED,YouTube,数据分析,教育,学习,演讲者,流行分析,时间序列分析,标签搜索
数据概述:
本数据集旨在为数据分析初学者提供一个使用真实数据探索领域的平台。通过TED演讲数据,学习者可以分析演讲内容,并且可以通过数据集提供的链接观看他们喜爱的演讲者的TED演讲。数据集包括两个版本:原始数据集(TED.csv)和预处理数据集(TED_Preprocessed.csv)。原始数据集包含TED YouTube频道上每个演讲的9个不同特征,包括视频链接、缩略图链接、视频时长、标题、观看次数、点赞次数、评论次数、发布日期和视频描述。
数据用途概述:
该数据集适用于多种数据分析场景,包括寻找最流行的TED演讲、确定最活跃的TED演讲者(按演讲次数)、按月分析TED演讲频率、按年分析TED演讲频率、查找特定作者的TED演讲、找到观看次数与点赞次数比最高的TED演讲、基于标签(如气候)查找TED演讲以及确定最活跃的TED演讲者(按观看次数)。此外,数据集也适合用于教育培训,帮助学习者同时掌握数据分析技能和从TED演讲者处获得的知识。
数据示例:
- video_link: https://www.youtube.com/watch?v=a1b2c3d4
- thumbnail_link: https://i.ytimg.com/vi/a1b2c3d4/default.jpg
- duration: 1200 秒
- title: "How to make history: Lisa Naegle at TEDxMileHigh"
- views: 2,500,000
- likes: 250,000
- comments: 5,000
- date: 2022-01-15
- description: "Lisa Naegle shares her journey of creating history..."
数据集来源:
该数据集从TED的官方YouTube频道抓取,并依据Creative Commons许可证提供。
数据集灵感来源:
由于TED是顶尖人才分享知识的最佳平台之一,因此创建这个数据集的目的是让学习者不仅能学习数据分析技能,还能从TED演讲者那里学习。