信贷违约预测数据集CreditDefaultPredictionDataset-zlpeachnice
数据来源:互联网公开数据
标签:信贷违约, 贷款风险, 信用评分, 机器学习, 风险评估, 金融风控, 数据挖掘, 贷款申请
数据概述:
该数据集包含来自金融机构的贷款申请与还款历史数据,用于构建信贷违约预测模型。主要特征如下:
时间跨度:数据未明确标明具体时间,但从“issueDate”(贷款发放日期)字段推断,数据覆盖了贷款申请与发放的时间段。
地理范围:数据未明确标明具体地理范围,但包含邮编和地区编码,推测为特定区域的贷款数据。
数据维度:数据集包括贷款金额、贷款期限、利率、分期付款额、信用等级、次级信用等级、就业信息、收入、验证状态、贷款用途、邮编、地区编码、债务收入比、逾期记录、信用评分范围、公开记录、公开破产记录、循环信用余额、循环信用利用率、总账户数、初次上市状态、申请类型、最早信用额度、标题、政策代码、以及一系列匿名特征(n0-n14)。其中,train.csv 包含“isDefault”(是否违约)标签,用于模型训练。
数据格式:CSV格式,包含train.csv (训练集) 和 testA.csv (测试集)两个文件,方便数据分析和建模。此外,还包含字体文件SimHei.ttf。
数据来源:数据来源于金融机构的贷款申请和还款记录,已进行匿名化处理。
该数据集适合用于信贷风险评估、信用评分建模以及违约预测等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用风险评估等领域的学术研究,如违约预测模型构建、影响因素分析等。
行业应用:可以为银行、消费金融公司等金融机构提供数据支持,特别是在贷款审批、风险定价、贷后管理等方面。
决策支持:支持金融机构的风险管理决策,优化信贷政策,降低不良贷款率。
教育和培训:作为金融风控、机器学习等相关课程的实训材料,帮助学生和从业者熟悉信贷数据分析流程。
此数据集特别适合用于探索影响信贷违约的关键因素,构建和优化预测模型,从而提升风险控制的准确性和效率。