信用卡支付违约预测数据集-2005年-tamilselvanarjunan
数据来源:互联网公开数据
标签:信用支付,违约预测,支付历史,账单金额,还款金额,客户特征,数据集
数据概述:
本数据集包含2005年信用卡用户的相关信息,用于预测用户是否会发生违约支付。数据集包含24个变量,其中1个响应变量,23个解释变量。响应变量为“是否违约支付”,用二进制值表示,1表示违约,0表示未违约。解释变量包括信贷金额、性别、教育程度、年龄、过去六个月的还款历史、每月的账单金额和还款金额。
具体字段定义如下:
X1: 信用额度(新台币):包括个人信用额度及其家庭(补充)信用额度。
X2: 性别(1 = 男;2 = 女)。
X3: 教育程度(1 = 研究生;2 = 大学;3 = 高中;4 = 其他)。
X5: 年龄(岁)。
X6 - X11: 过去六个月的还款历史。数据记录了2005年4月至9月的每月还款情况:
X6 = 2005年9月的还款状态;
X7 = 2005年8月的还款状态;
X8 = 2005年7月的还款状态;
X9 = 2005年6月的还款状态;
X10 = 2005年5月的还款状态;
X11 = 2005年4月的还款状态。
还款状态的测量尺度为:-1 = 按时还款;1 = 迟还一个月;2 = 迟还两个月;...;8 = 迟还八个月;9 = 迟还九个月及以上。
X12 - X17: 每月账单金额(新台币)。X12 = 2005年9月的账单金额;X13 = 2005年8月的账单金额;...;X17 = 2005年4月的账单金额。
X18 - X23: 每月还款金额(新台币)。X18 = 2005年9月的还款金额;X19 = 2005年8月的还款金额;...;X23 = 2005年4月的还款金额。
数据用途概述:
该数据集适用于信用风险评估、违约预测模型开发、客户信用行为研究等多种场景。金融机构可以利用此数据进行信用风险分析,识别高违约风险的客户群体;研究人员可以利用此数据进行信用行为模式的研究,为信贷政策制定提供数据支持;教育机构亦可将其用于金融统计与信用风险管理的教学和实践。