信用评分预测数据集CreditScoringPredictionDataset-ihorpryshchepa
数据来源:互联网公开数据
标签:信用评分, 风险评估, 贷款违约, 机器学习, 数据建模, 金融风控, 信用风险, 数据分析
数据概述:
该数据集包含用于信用评分建模与风险评估的客户信用相关数据。主要特征如下:
时间跨度:数据未标明具体时间,可视为静态数据集。
地理范围:数据未明确标注来源地区,但数据特征与欧美金融市场常见指标相似。
数据维度:数据集包含多个关键字段,如客户ID(client_id)、债务收入比(DIR)、年龄(Age)、贷款数量(NumLoans)、房地产贷款数量(NumRealEstateLoans)、受抚养人数(NumDependents)、30-59天逾期次数(Num30-59Delinquencies)、60-89天逾期次数(Num60-89Delinquencies)、收入(Income)、信用额度使用率(BalanceToCreditLimit)以及90天以上逾期(Delinquent90,仅在训练集中出现)等。
数据格式:数据集以CSV格式提供,包含训练集(credit_scoring_train.csv)和测试集(credit_scoring_test.csv)两个文件,训练集包含目标变量Delinquent90,测试集用于模型预测。
数据来源:数据来源于公开的信用评分数据集,已进行匿名化处理,便于模型训练与评估。
该数据集适合用于信用风险建模、贷款违约预测、信用评分卡构建等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分模型研究、以及机器学习模型的比较与优化等学术研究。
行业应用:为银行、消费金融公司等金融机构提供数据支持,用于客户信用评估、贷款审批、风险定价等。
决策支持:支持金融机构的风险管理决策,优化信贷策略,降低坏账率。
教育和培训:作为金融风控、数据挖掘、机器学习等课程的实训案例,帮助学生和从业者掌握信用评分建模技能。
此数据集特别适合用于探索信用风险的影响因素,构建和评估信用评分模型,预测客户的违约概率,从而优化信贷决策。