播客收听时长预测数据集-2023-ysthehurricane
数据来源:互联网公开数据
标签:播客,预测模型,收听时长,数据分析,音频内容,听众行为,播客属性
数据概述:
本数据集包含多个播客节目的信息及其属性,旨在分析和预测播客节目的平均收听时长。数据集涵盖了播客名称、节目标题、节目长度、节目类型、主持人受欢迎程度、发布日期、发布时间、嘉宾受欢迎程度、广告数量以及节目内容情感等多个特征。
数据集字段定义如下:
Podcast_Name:播客名称,字符串类型。描述了流行播客的名称。
Example Values: "科技对话", "健康时刻", "喜剧中心"
Episode_Title:节目标题,字符串类型。描述了播客节目的具体标题。
Example Values: "人工智能的未来", "冥想技巧", "单口喜剧专场"
Episode_Length:节目长度,浮点数类型,单位为分钟。描述了播客节目的时长。
Example Values: 5.0, 10.0, 30.0, 45.0, 60.0, 90.0
Genre:节目类型,字符串类型。描述了播客节目的类型。
Possible Values: "科技", "教育", "喜剧", "健康", "真凶揭秘", "商业", "体育", "生活方式", "新闻", "音乐"
Host_Popularity:主持人受欢迎程度,浮点数类型,取值范围为0-100。描述了主持人受欢迎的程度。
Example Values: 50.0, 75.0, 90.0
Publication_Day:发布日期,字符串类型。描述了播客节目发布的具体星期几。
Possible Values: "周一", "周二", "周三", "周四", "周五", "周六", "周日"
Publication_Time:发布时间,字符串类型。描述了播客节目发布的具体时间段。
Possible Values: "早晨", "下午", "傍晚", "夜间"
Guest_Popularity:嘉宾受欢迎程度,浮点数类型,取值范围为0-100。描述了嘉宾(如有)受欢迎的程度。
Example Values: 20.0, 50.0, 85.0
Number_of_Ads:广告数量,整数类型。描述了节目中广告的数量。
Example Values: 0, 1, 2, 3
Episode_Sentiment:节目内容情感,字符串类型。描述了节目内容的情感倾向。
Possible Values: "正面", "中性", "负面"
Listening_Time:收听时长,浮点数类型,单位为分钟。描述了节目实际的平均收听时长(目标变量)。
Example Values: 4.5, 8.0, 30.0, 60.0
数据用途概述:
该数据集适用于播客内容分析、听众行为研究、广告优化策略制定等多种场景。研究人员可以利用此数据集进行数据分析,预测播客节目的潜在收听时长;广告商可以根据数据调整广告策略;内容创作者可参考数据优化节目内容。此外,该数据集也适合用于教育培训,帮助学习者理解和分析播客节目的听众行为模式。