移动游戏用户流失预测数据集

移动游戏用户流失预测数据集

数据来源:互联网公开数据

标签:移动游戏, 用户行为, 流失预测, 留存分析, 游戏级别, 数据挖掘, 时间序列

数据概述

本数据集来源于一款轻度休闲类移动游戏,游戏的核心玩法是用户不断挑战并升级关卡,每个关卡的任务是在限定步骤内达到特定目标。用户可能成功或失败完成关卡,通常需要完成当前关卡后才能进入下一关,过程中可使用道具或提示来辅助完成任务。

数据集涵盖了2020年2月1日至2月4日期间注册的用户行为数据,经过筛选后,仅保留了那些在过去四天内至少登录过两天的用户。流失的定义是:在接下来的一周(2月7日至2月13日)内未登录游戏,则视为流失用户。该数据集以更接近原始日志的形式呈现,包含5个文件,具有更贴近实际业务场景的原始数据特性。

数据文件说明 1. train.csv
- 包含训练集用户数据,包括用户ID和对应的流失标签(1:流失,0:留存)。 2. dev.csv
- 验证集数据,格式与训练集一致,主要用于离线测试和模型选择。 3. test.csv
- 测试集数据,仅包含用户ID,目标是预测这些用户的流失率。 4. level_seq.csv
- 核心数据文件,记录用户在每个关卡的游玩记录,每条记录代表一次关卡挑战尝试。字段说明如下: - user_id:用户ID,可与训练集、验证集和测试集中的用户ID匹配。 - level_id:关卡ID。 - f_success:是否成功完成关卡(1:成功,0:失败)。 - f_duration:尝试持续时间(单位:秒)。 - f_reststep:剩余步骤与限定步骤的比率(失败时为0)。 - f_help:是否使用额外帮助(如道具或提示,1:使用,0:未使用)。 - time:时间戳。 5. level_meta.csv
- 记录每个关卡的统计特性,用于表示关卡难度或特征,字段说明如下: - f_avg_duration:每次尝试的平均持续时间(单位:秒,包含成功和失败尝试)。 - f_avg_passrate:关卡通过率。 - f_avg_win_duration:每次成功通过的平均持续时间(仅包含成功尝试)。 - f_avg_retrytimes:平均重试次数(再次挑战同一关卡被视为第一次重试)。 - level_id:关卡ID,可与level_seq.csv中的关卡ID匹配。

数据用途概述

本数据集适用于以下场景: 1. 用户行为分析
研究用户在游戏中的行为模式,如挑战关卡的成功率、使用辅助工具的频率、时间投入等,从而深入理解用户的游戏体验。

  1. 流失预测与留存优化
    利用训练集和验证集数据构建模型,预测测试集用户是否将流失。这有助于游戏公司采取针对性的策略,如推送激励活动、优化关卡设计,以提高用户留存率。

  2. 关卡设计优化
    通过分析level_meta.csv中提供的关卡统计特征,评估关卡难度是否合理,找出可能导致用户流失的关键关卡,进而优化游戏体验。

  3. 游戏运营决策支持
    帮助游戏运营团队制定更精准的用户分层策略,例如为不同流失风险的用户提供定制化的激励措施或内容推荐。

  4. 学术研究与教学
    数据集可用于学术研究中,探索用户行为与流失之间的关系,也可作为教学案例,帮助学生学习用户行为分析、数据挖掘和机器学习模型的应用。

数据集特点 - 时间序列特性:数据记录了用户在不同时间点的行为,适合进行时间序列分析。 - 多层次数据:包含用户行为数据(level_seq.csv)和关卡特性数据(level_meta.csv),支持多维度的分析与建模。 - 标签明确:训练集和验证集提供了清晰的流失标签,便于构建监督学习模型。 - 真实性高:数据接近原始日志格式,保留了用户行为的原始细节,贴近实际业务场景。

通过本数据集,研究人员、游戏开发者或运营人员可以深入探索用户行为模式,预测用户流失风险,优化游戏设计和运营策略,从而提升用户体验和商业价值。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 25.86 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。