Trell社交媒体使用行为分析数据集-2023-adityak80
数据来源:互联网公开数据
标签:社交媒体,用户行为,数据分析,视频观看,用户特征,用户互动,内容消费,用户年龄,用户性别,城市层级
数据概述:
本数据集包含了25个独立特征和1个依赖特征,旨在分析Trell平台上用户的社交媒体使用行为。数据集中的每个记录代表一个用户,并提供了多个维度的信息,包括用户的基本属性、社交互动、视频观看习惯等内容。
数据字段定义如下:
userId:每个用户的唯一编号。
tier:用户所在城市的层级。
gender:用户性别,1表示男性,2表示女性。
following_rate:用户关注的账户数量(已归一化)。
followers_avg_age:用户所有关注者的平均年龄组。
following_avg_age:用户关注的所有账户的平均年龄组。
max_repetitive_punc:用户简介和评论中出现的最大重复标点符号数量。
num_of_hashtags_per_action:用户每条评论中使用的平均标签数量。
emoji_count_per_action:用户每条评论中使用的平均表情符号数量。
punctuations_per_action:用户每条评论中使用的平均标点符号数量。
number_of_words_per_action:用户每条评论中使用的平均单词数量。
avgCompletion:用户观看视频的平均完成率。
avgTimeSpent:用户在单个视频上花费的平均时间(秒)。
avgDuration:用户迄今为止观看的视频的平均时长。
avgComments:用户观看的每个视频的平均评论数量。
creations:用户上传的视频总数。
content_views:用户观看的视频总数。
num_of_comments:用户发表的评论总数(已归一化)。
weekends_trails_watched_per_day:用户在周末每天观看的视频数量。
weekdays_trails_watched_per_day:用户在工作日每天观看的视频数量。
slot1_trails_watched_per_day:一天分为4个时段,此特征表示用户在该时段观看的平均视频数量。
slot2_trails_watched_per_day:一天分为4个时段,此特征表示用户在该时段观看的平均视频数量。
slot3_trails_watched_per_day:一天分为4个时段,此特征表示用户在该时段观看的平均视频数量。
slot4_trails_watched_per_day:一天分为4个时段,此特征表示用户在该时段观看的平均视频数量。
avgt2:用户关注的所有账户的平均关注者数量。
age_group:用户的年龄组,分为4个组别:1表示小于18岁;2表示18-24岁;3表示24-30岁;4表示大于30岁。
数据用途概述:
该数据集适用于社交媒体使用行为分析、用户特征研究、内容消费模式探索、用户互动分析等场景。研究人员可以利用此数据了解不同用户群体的社交媒体使用习惯;企业可以分析用户行为以优化广告投放策略;营销人员可以基于数据制定更有效的营销计划;政策制定者可以评估社交媒体平台的使用情况及其对社会的影响。数据集也适合用于教育培训,帮助学习者掌握社交媒体分析的基本方法和技巧。