信贷违约风险预测数据集CreditDefaultRiskPredictionDataset-mamadoulaminediagne
数据来源:互联网公开数据
标签:信贷风险, 违约预测, 金融风控, 机器学习, 贷款数据, 客户画像, 时间序列, 风险评估
数据概述:
该数据集包含来自Zindi平台的信贷数据,记录了贷款相关的交易信息和客户属性,用于预测贷款违约风险。主要特征如下:
时间跨度:数据未明确标注具体时间范围,但包含贷款的放款日期和到期日期,可用于分析贷款周期。
地理范围:数据来源未明确标注,但包含“country_id”字段,表明数据可能涉及多个国家或地区。
数据维度:数据集包含多个关键字段,如ID(贷款唯一标识)、customer_id(客户标识)、country_id(国家标识)、tbl_loan_id(贷款记录标识)、lender_id(贷款机构标识)、loan_type(贷款类型)、Total_Amount(贷款总额)、Total_Amount_to_Repay(应还总额)、disbursement_date(放款日期)、due_date(到期日期)、duration(贷款期限)、New_versus_Repeat(新客户或复借客户)、Amount_Funded_By_Lender(贷款人出资额)、Lender_portion_Funded(贷款人出资比例)、Lender_portion_to_be_repaid(贷款人应收回金额)以及预测目标变量target (违约状态)。
数据格式:CSV格式,包括SampleSubmission.csv(提交格式示例)、Test.csv(测试集)、Train.csv(训练集),方便数据分析和模型训练。
来源信息:数据集来源于Zindi平台,为开放获取的数据集,已进行初步的数据整理和清洗。
该数据集适合用于信贷风险评估、违约预测、客户信用评分等研究和应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风控、信用风险管理、机器学习模型优化等研究,例如,评估不同客户群体的违约概率、分析贷款期限与违约风险之间的关系等。
行业应用:为金融机构、信贷平台提供数据支持,用于风险定价、贷款审批、客户细分等业务,提升风险管理水平。
决策支持:支持金融机构的信贷决策,优化贷款策略,降低坏账率,提高盈利能力。
教育和培训:作为金融风控、机器学习等相关课程的实训案例,帮助学生和从业者深入理解信贷风险管理。
此数据集特别适合用于构建和评估信贷违约预测模型,深入研究影响贷款违约的关键因素,以及探索不同风险管理策略的效果,从而提升风险控制水平。