数据集说明:
该数据集包含来自某电信服务提供商的客户信息与服务使用情况数据,主要用于分析客户流失行为。每条记录代表一位客户的基本属性、服务使用情况、账单信息以及其是否流失的标签。
字段定义:
gender:客户性别(0=女性,1=男性)
seniorcitizen:是否为老年人(0=否,1=是)
partner:是否有配偶(0=否,1=是)
dependents:是否有家属(0=否,1=是)
tenure:客户持续服务月份数
phoneservice:是否有电话服务(0=否,1=是)
multiplelines:是否有多条电话线路(0=否,1=是)
onlinesecurity:是否有网络安全服务(0=否,1=是)
onlinebackup:是否有在线备份服务(0=否,1=是)
deviceprotection:是否有设备保护服务(0=否,1=是)
techsupport:是否有技术支持服务(0=否,1=是)
streamingtv:是否订阅流媒体电视(0=否,1=是)
streamingmovies:是否订阅流媒体电影(0=否,1=是)
paperlessbilling:是否启用电子账单(0=否,1=是)
monthlycharges:每月账单金额(美元)
totalcharges:累计账单金额(美元)
label:客户是否流失(0=未流失,1=已流失)
虚拟变量(哑变量)字段:
contract_Month-to-month:合同类型是否为按月续约(1=是)
contract_One year:合同类型是否为一年期(1=是)
contract_Two year:合同类型是否为两年期(1=是)
paymentmethod_Electronic check:支付方式是否为电子支票
paymentmethod_Credit card (automatic):支付方式是否为自动信用卡
paymentmethod_Mailed check:支付方式是否为邮寄支票
paymentmethod_Bank transfer (automatic):支付方式是否为自动银行转账
internetservice_Fiber optic:是否使用光纤上网服务
internetservice_DSL:是否使用DSL上网服务
internetservice_No:是否无上网服务
数据特征:
数据类型:结构化表格数据,数值型与分类变量混合
记录总数:约7000条(可视原始文件而定)
特征总数:26项特征+1个目标变量(流失标签)
多个服务项字段采用独立布尔变量形式记录
适用场景:
客户流失预测建模
电信用户行为分析
交叉服务销售策略评估
客户生命周期管理