巴基斯坦顶尖娱乐频道电视剧数据集

巴基斯坦顶尖娱乐频道电视剧数据集 数据来源:互联网公开数据 标签:巴基斯坦,娱乐频道,电视剧,观众数量,数据分析,YouTube数据,行业分析 数据概述: 本数据集收录了巴基斯坦排名前三的娱乐频道所播出的电视剧信息,包括频道名称及其订阅者数量,以及这些频道的播放列表和单个视频的详细数据。数据集旨在确定巴基斯坦最领先的娱乐频道,并识别观众数量最多的电视剧。 数据用途概述: 该数据集适用于娱乐行业的分析、观众行为研究、市场趋势分析以及内容推荐系统的开发。通过分析频道排名和电视剧的观众数量,市场研究者可以识别出最受欢迎的娱乐内容和潜在的市场机会。此外,数据集也适合用于教育培训,帮助学习者了解巴基斯坦娱乐行业的动态发展状况。 数据集包含三个CSV文件,分别总结播放列表的详细信息、单个视频的信息(如基本数据、观看次数、点赞数、评论数以及相应的播放列表或视频URL),以及每部电视剧的编剧、导演、制片人、导演和类型信息。 在数据提取过程中,通过YouTube API、Pytube库和网页抓取三种方法从YouTube获取数据。由于YouTube的数据提取限制在每次最多50行,因此采用了多种方法确保数据的完整性。具体提取过程中,排除了包含短片、颁奖典礼、斋月播出内容、伊德相关节目、报仇月内容、最佳片段、谈话节目、预告片、闪回片段、原声带/歌曲、预告、访谈等非电视剧内容的播放列表。同时,还排除了空播放列表或包含隐藏/私有视频的播放列表。有大约38.7%的播放列表由于上述原因被排除在外。对于包含至少一个视频的播放列表,通过YouTube和维基百科提取了关于编剧、导演、制片人和类型的详细信息,共涉及683个播放列表(电视剧)。 数据集中的变量包括:Video_CSV(Video_Id, Channel_Title, Channel_ID, Playlist_Title, Playlist_Id, Playlist_Published_Date, Vid_Title, Duration, Views, Likes, Fav Comments, Comments, Video_Published Date, Video_Url),Playlist_CSV(Playlist_Id, Playlist_Title, Channel_Title, Channel_ID, Playlist_Published_Date, Remarks, No. of Videos, Views, Likes, Comments, Playlist_Url),以及Playlist_Genres(Playlist_Id, Playlist_Title, Writer, Director, Producer and Genres)。 该数据集可用于机器学习建模、巴基斯坦最成功电视剧分析以及三大娱乐频道的比较分析。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.52 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。