信贷违约预测数据集CreditDefaultPredictionDataset-fanshuangshuang
数据来源:互联网公开数据
标签:信贷违约, 贷款风险, 信用评分, 金融风控, 机器学习, 数据建模, 风险评估, 违约预测
数据概述:
该数据集包含来自信贷平台的贷款申请数据,记录了借款人的各项财务信息和贷款详情,用于构建信贷违约预测模型。主要特征如下:
时间跨度:数据记录的时间范围,从贷款发放日期开始。
地理范围:数据未明确标明具体地理范围,但从邮编和地区编码来看,可能覆盖特定地区。
数据维度:数据集包括“id”(贷款申请标识)、“loanAmnt”(贷款金额)、“term”(贷款期限)、“interestRate”(利率)、“installment”(分期付款额)、“grade”(贷款等级)、“subGrade”(子等级)、“employmentTitle”(就业职称)、“employmentLength”(就业年限)、“homeOwnership”(房屋所有权)、“annualIncome”(年收入)、“verificationStatus”(认证状态)、“issueDate”(发放日期)、“purpose”(贷款目的)、“postCode”(邮编)、“regionCode”(地区编码)、“dti”(债务收入比)、“delinquency_2years”(两年内逾期次数)、“ficoRangeLow”(FICO评分下限)、“ficoRangeHigh”(FICO评分上限)、“openAcc”(公开账户数量)、“pubRec”(公共记录)、“pubRecBankruptcies”(公开破产记录)、“revolBal”(循环信用余额)、“revolUtil”(循环信用利用率)、“totalAcc”(总账户数量)、“initialListStatus”(初始上市状态)、“applicationType”(申请类型)、“earliesCreditLine”(最早信用额度)、“title”(标题)、“policyCode”(政策代码)、“n0”到“n14”(衍生特征)等多个字段。
数据格式:CSV格式,包含train.csv (训练集) 和 testA.csv (测试集) 两个文件,便于数据分析和模型训练。
来源信息:数据来源于公开的信贷平台,已进行脱敏处理。
该数据集适合用于信贷风险评估、违约预测、信用评分建模等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分、机器学习等领域的学术研究,如探索影响信贷违约的关键因素、开发更精确的违约预测模型等。
行业应用:可以为信贷机构、消费金融公司提供数据支持,尤其在风险控制、客户信用评估、贷款审批等方面提供决策支持。
决策支持:支持信贷机构优化贷款策略、控制风险敞口、提高盈利能力。
教育和培训:作为金融风控、机器学习、数据分析等课程的实训材料,帮助学生和从业者深入理解信贷风险管理。
此数据集特别适合用于构建和评估信贷违约预测模型,帮助用户实现风险最小化和收益最大化。