数据集

台湾信用卡违约预测数据集2005年-reeljojo

台湾信用卡违约预测数据集2005年-reeljojo 数据来源：互联网公开数据标签：信用卡违约,预测模型,数据挖掘,客户信用,风险评估,台湾,机器学习

数据概述：本数据集包含2005年4月至9月期间台湾地区客户的信用卡使用和还款记录，旨在研究客户的违约支付情况，并比较六种数据挖掘方法在预测违约概率方面的准确性。研究采用了“排序平滑法”来估计真实的违约概率，并通过简单线性回归分析发现，人工神经网络模型在预测违约概率方面表现最佳，具有最高的决定系数，回归截距接近零，回归系数接近一。

数据集包含24个字段，包括一个响应变量和23个解释变量： - 响应变量：违约支付（是=1，否=0） - 解释变量： X1: 授信额度（新台币） X2: 性别（1=男，2=女） X3: 教育程度（1=研究生，2=大学，3=高中，4=其他） X4: 婚姻状况（1=已婚，2=单身，3=其他） X5: 年龄（岁） X6-X11: 过去六个月的还款状态（-1=按时还款，1=延付1个月，2=延付2个月，...，8=延付8个月，9=延付9个月以上） X12-X17: 过去六个月的账单金额（新台币） X18-X23: 过去六个月的还款金额（新台币）

数据来源为UCI机器学习库，具有较高的权威性和实用性。

数据用途概述：该数据集适用于信用风险评估、客户信用分析、违约预测模型开发等多种场景。金融机构可以利用此数据优化信用评估模型，提高风险控制能力；研究人员可以利用此数据进行算法比较和性能评估；教育机构可以将其作为数据分析和机器学习课程的教学素材。该数据集为相关领域的研究和实践提供了宝贵的数据支持。

数据与资源

versions_20250412034653.zipZIP
2.32 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	2.32 MiB
最后更新	2025年4月22日
创建于	2025年4月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

台湾信用卡违约预测数据集2005年-reeljojo

数据与资源

附加信息

注册成功！