信贷风险评估数据集CreditRiskAssessmentDataset-jianhaoji
数据来源:互联网公开数据
标签:信贷风险, 贷款违约, 机器学习, 金融风控, 数据分析, 风险预测, 信用评分, 数据建模
数据概述:
该数据集包含来自金融机构的信贷数据,记录了借款人的贷款申请信息及最终的违约情况,用于信贷风险评估和预测。主要特征如下:
时间跨度:数据记录的时间范围为借款人的贷款申请时间及后续的信用表现,具体时间跨度依赖于原始数据的时间范围。
地理范围:数据覆盖范围未明确,但通常代表特定国家或地区的信贷市场。
数据维度:数据集包括借款人的个人信息、贷款信息、信用历史等多个维度,具体字段包括贷款金额(loanAmnt)、贷款期限(term)、利率(interestRate)、月供(installment)、信用等级(grade, subGrade)、就业信息(employmentTitle, employmentLength)、住房状况(homeOwnership)、年收入(annualIncome)、验证状态(verificationStatus)、贷款发放日期(issueDate)、是否违约(isDefault)、贷款用途(purpose)、邮编(postCode)、地区代码(regionCode)、债务收入比(dti)、逾期记录(delinquency_2years)、信用评分范围(ficoRangeLow, ficoRangeHigh)、公开记录(pubRec, pubRecBankruptcies)、循环信用余额(revolBal, revolUtil)、总账户数(totalAcc)、首次上市状态(initialListStatus)、申请类型(applicationType)、最早信用额度开立时间(earliesCreditLine)以及各种衍生特征(n0-n14, num_years, issueDate_now_year, earliesCreditLine_now_year等)。
数据格式:CSV格式,包含两个文件:new_test_data_FE_3.csv(测试集)和new_train_data_FE_3.csv(训练集),方便进行模型训练和评估。数据已进行特征工程处理,包含原始特征和衍生特征。
该数据集适合用于信贷风险建模,违约预测,以及探索不同特征对贷款违约的影响。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分模型、贷款违约预测等方面的学术研究,如评估不同特征对违约概率的影响、比较不同模型的预测性能等。
行业应用:为金融机构提供数据支持,尤其适用于信贷审批、风险定价、贷后管理等环节,帮助机构更精准地评估借款人的信用风险。
决策支持:支持金融机构的风险管理决策,优化信贷策略,提高贷款组合的盈利能力。
教育和培训:作为金融风控、机器学习等相关课程的实训材料,帮助学生和从业者深入理解信贷风险评估的原理和方法。
此数据集特别适合用于构建和优化信贷风险预测模型,帮助用户提升风险管理水平,降低信贷损失,实现更稳健的业务发展。