美国小企业贷款违约预测数据集USSmallBusinessLoanDefaultPrediction-aggle6666
数据来源:互联网公开数据
标签:小企业贷款,违约预测,金融风控,机器学习,贷款审批,风险评估,信用分析,商业数据
数据概述:
该数据集包含来自美国小企业管理局(SBA)的小企业贷款相关数据,用于分析和预测贷款违约风险。主要特征如下:
时间跨度:数据未明确标注时间范围,但根据“ApprovalFY”字段推测为2000年代初期的贷款数据。
地理范围:数据覆盖美国各州及地区,记录了不同地区的贷款申请和审批情况。
数据维度:数据集包括贷款状态(MIS_Status)、贷款编号、借款人信息(姓名、城市、州、邮编)、银行信息(银行名称、银行所在州)、行业分类(NAICS)、审批日期、审批年份、贷款期限、员工数量、企业类型、创造就业岗位数、保留就业岗位数、特许经营代码、城乡类型、循环信用额度、低文档贷款、放款日期、放款总额、余额总额、批准总额、SBA担保额、新企业、房地产、担保比例、经济衰退指标等多个字段。
数据格式:CSV格式,包含loan_train.csv(训练集)和loan_test.csv(测试集)两个文件,便于数据分析和建模。数据已进行初步处理,可以直接用于建模和分析。
该数据集适合用于小企业贷款违约风险评估、信用风险建模和贷款审批流程优化等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信贷评估、机器学习等领域的研究,如贷款违约预测模型构建、影响违约的关键因素分析等。
行业应用:为银行、金融机构和贷款平台提供数据支持,可用于优化贷款审批流程、提高风险控制能力、制定差异化贷款策略。
决策支持:支持金融机构的风险管理决策,帮助其更准确地评估贷款风险、降低坏账率。
教育和培训:作为金融风控、信用评估、数据分析等相关课程的实训案例,帮助学生和从业人员掌握数据分析和建模技能。
此数据集特别适合用于研究影响小企业贷款违约的关键因素,构建预测模型,并优化贷款审批流程,以实现风险控制和业务增长的平衡。