客户信用风险评估特征数据集_Customer_Credit_Risk_Assessment_Feature_Dataset
数据来源:互联网公开数据
标签:信用风险, 客户画像, 机器学习, 金融风控, 贷款违约, 特征工程, 数据分析, 风险预测
数据概述:
该数据集包含客户信用风险评估的相关特征,用于构建信用风险预测模型。主要特征如下:
时间跨度:数据未明确标注时间跨度,通常视作静态数据集,用于分析客户静态特征与信用风险的关系。
地理范围:数据未明确标注地理范围,但根据数据特征推测可能来自全球范围内的客户。
数据维度:数据集包含大量客户特征,涵盖人口统计学、信贷历史、财产信息等,主要特征包括:客户ID、子女数量、年收入、贷款金额、年金、人口相对密度、年龄、工作时长、注册时长、发布ID时长、自有车辆年龄、移动设备标志、工作电话标志、联系移动设备标志、电话标志、电子邮件标志、家庭成员数量、地区评分、申请处理开始时间、未居住地区、未工作地区、未居住与工作地区、未注册城市、未工作城市、未工作城市、外部数据源1-3、公寓平均值、地下室面积平均值、建筑物使用年份平均值、建筑物建造年份平均值、公共区域平均值、电梯平均值、入口平均值、最高楼层平均值、最低楼层平均值、土地面积平均值、非居住公寓平均值、非居住面积平均值、社交圈观察次数、30天内违约人数、60天内违约人数、最后一次电话变更时长、多种文档标志、信用局相关信息等。
数据格式:CSV格式,包含train_removed_collinear.csv 和 test_removed_collinear.csv两个文件,便于数据分析和模型训练。其中,train文件为训练集,test文件为测试集。
来源信息:数据来源于金融风控相关的公开数据集,已进行特征工程处理,例如可能移除了共线性特征。
该数据集适合用于信用风险建模、客户细分、风险预警等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分模型研究等学术研究,例如探索不同特征对贷款违约的影响、比较不同模型的预测性能等。
行业应用:为银行、消费金融公司等金融机构提供数据支持,用于客户信用评估、风险定价、贷款审批流程优化等。
决策支持:支持金融机构的风险管理决策,例如优化信贷政策、调整风险偏好、提高资产质量等。
教育和培训:作为金融风控、机器学习、数据分析等课程的实训素材,帮助学生和从业者理解信用风险评估的流程和方法。
此数据集特别适合用于构建和评估信用风险预测模型,帮助用户识别高风险客户、优化信贷决策、提升风险管理水平。