数据概述:
本数据集包含两部分,旨在用于电信用户流失预测。
train.csv:该数据集包含历史数据,其中包括客户是否流失的信息。特征包括customerID(客户ID),gender(性别),SeniorCitizen(是否为老年人),Partner(是否有伴侣),Dependents(是否有家属),tenure(客户在公司的时间),PhoneService(是否有电话服务),MultipleLines(是否有多个线路),InternetService(互联网服务类型),OnlineSecurity(是否有在线安全),OnlineBackup(是否有在线备份),DeviceProtection(是否有设备保护),TechSupport(是否有技术支持),StreamingTV(是否有流媒体电视),StreamingMovies(是否有流媒体电影),Contract(合同类型),PaperlessBilling(是否无纸化账单),PaymentMethod(支付方式),MonthlyCharges(月消费),TotalCharges(总消费),以及Churn(是否流失)。
active_customers.csv:该数据集包含当前活跃用户的数据,不包含'Churn'标签。目的是预测这些活跃用户在不久的将来流失的可能性。
数据用途概述:
该数据集主要用于构建机器学习模型,以预测电信用户流失。通过分析历史数据,可以识别出导致用户流失的关键因素,从而帮助电信公司采取积极措施,例如个性化营销、改进服务等,以提高客户留存率。该数据集适用于数据挖掘、机器学习、商业分析等领域,可用于训练和评估流失预测模型,进行用户行为分析,以及制定客户关系管理策略。