信用评分模型构建-信贷违约风险预测数据集

信用评分模型构建-信贷违约风险预测数据集 数据来源:互联网公开数据 标签:信用评分,风险评估,信贷违约,机器学习,金融风控,时间序列,二元分类,信贷产品 数据概述: 本数据集旨在用于信用评分模型的构建与验证,主要用于预测客户的信贷违约风险。数据集包含了与信贷产品相关的多个特征变量,以及表示客户是否发生违约的标签。数据来源于信贷申请和历史还款记录,经过脱敏处理后用于学术研究和模型开发。数据集包含训练集和测试集,训练集带有目标变量,用于模型训练;测试集不包含目标变量,用于评估模型的泛化能力。

数据集中包含以下字段类型: * 标识符字段: 唯一标识每笔信贷申请的ID。 * 目标变量: flag,表示客户是否违约,1代表违约,0代表未违约。 * 时间相关字段: 描述了信贷产品的时间属性,例如信贷产品开设时间、还款时间等。 * 信用历史字段: 记录了客户的还款行为,包括逾期情况、逾期天数、逾期金额等。 * 信用额度相关字段: 记录了信贷产品的额度信息,包括信用额度、已使用额度等。 * 状态编码字段: 编码了信贷产品的状态、账户类型、货币类型、信贷类型等信息。 * 二元标志字段: 标识了特定情况,例如是否存在逾期、是否超限等。

数据用途概述: 该数据集主要用于信用评分模型的构建和验证,可用于: * 信贷风险评估: 预测客户的信贷违约概率,辅助信贷决策。 * 信用评分模型开发: 训练机器学习模型,构建信用评分卡。 * 风险管理: 识别高风险客户,采取相应的风险控制措施。 * 数据分析与研究: 研究信贷违约的影响因素,探索信贷风险管理方法。 * 教育培训: 用于金融风控、信用评分等相关课程的教学和实践。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1044.12 MiB
最后更新 2025年9月12日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。