电信客户流失预测数据集TelecomCustomerChurnPrediction-lilongzkl

电信客户流失预测数据集TelecomCustomerChurnPrediction-lilongzkl

数据来源:互联网公开数据

标签:客户流失, 电信行业, 用户行为分析, 机器学习, 数据挖掘, 预测模型, 客户画像, 风险评估

数据概述: 该数据集包含来自电信运营商的客户数据,记录了客户的个人信息、使用行为、消费习惯等,用于预测客户是否会流失。主要特征如下: 时间跨度:数据未明确标示时间跨度,但包含了客户生命周期内的历史行为数据。 地理范围:数据未限定具体地理区域,但涵盖了多个客户的特征信息。 数据维度:数据集包括“客户ID”、“地理区域”、“是否双频”、“是否翻新机”、“当前手机价格”、“手机网络功能”、“婚姻状况”、“家庭成人人数”、“信息库匹配”、“预计收入”、“信用卡指示器”、“当前设备使用天数”、“在职总月数”、“家庭中唯一订阅者的数量”、“家庭活跃用户数”、“新手机用户”、“信用等级代码”、“平均月费用”、“每月平均使用分钟数”、“平均超额使用分钟数”、“平均超额费用”、“平均语音费用”、“数据超载的平均费用”、“平均漫游呼叫数”、“当月使用分钟数与前三个月平均值的百分比变化”、“当月费用与前三个月平均值的百分比变化”、“平均掉线语音呼叫数”、“平均丢弃数据呼叫数”、“平均占线语音呼叫数”、“平均占线数据调用次数”、“平均未接语音呼叫数”、“未应答数据呼叫的平均次数”、“尝试拨打的平均语音呼叫次数”、“尝试数据调用的平均数”、“平均接听语音电话数”、“平均完成的语音呼叫数”、“完成数据调用的平均数”、“平均客户服务电话次数”、“使用客户服务电话的平均分钟数”、“一分钟内的平均呼入电话数”、“平均三通电话数”、“已完成语音通话的平均使用分钟数”、“平均呼入和呼出高峰语音呼叫数”、“平均峰值数据调用次数”、“使用高峰语音通话的平均不完整分钟数”、“平均非高峰语音呼叫数”、“非高峰数据呼叫的平均数量”、“平均掉线或占线呼叫数”、“平均尝试调用次数”、“平均已完成呼叫数”、“平均呼叫转移呼叫数”、“平均呼叫等待呼叫数”、“账户消费限额”、“客户生命周期内的总通话次数”、“客户生命周期内的总使用分钟数”、“客户生命周期内的总费用”、“计费调整后的总费用”、“计费调整后的总分钟数”、“计费调整后的呼叫总数”、“客户生命周期内平均月费用”、“客户生命周期内的平均每月使用分钟数”、“客户整个生命周期内的平均每月通话次数”、“过去三个月的平均每月使用分钟数”、“过去三个月的平均每月通话次数”、“过去三个月的平均月费用”、“过去六个月的平均每月使用分钟数”、“过去六个月的平均每月通话次数”、“过去六个月的平均月费用”等50多个特征变量,以及目标变量“是否流失”。 数据格式:CSV格式,包含train.csv(训练集)、test.csv(测试集)和sample_submit.csv(提交示例)三个文件,便于数据分析和模型训练。数据已进行匿名化处理,包含数值型和类别型变量。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于电信行业客户流失预测相关的学术研究,例如用户行为分析、流失因素挖掘、预测模型构建等。 行业应用:为电信运营商提供数据支持,用于客户流失预警、精准营销、个性化服务推荐等,帮助运营商降低客户流失率,提升客户满意度。 决策支持:支持电信运营商的决策制定,优化客户关系管理策略,制定有效的挽留方案,提升市场竞争力。 教育和培训:作为数据科学、机器学习、客户关系管理等相关课程的实训数据,帮助学生和研究人员掌握客户流失预测技术。 此数据集特别适合用于构建和评估客户流失预测模型,探索影响客户流失的关键因素,帮助用户实现客户挽留、提升客户价值的目标。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 29, 2025, 02:50 (UTC)
创建于 五月 29, 2025, 02:50 (UTC)