信贷违约风险预测数据集CreditDefaultRiskPredictionDataset-ghanyfitria
数据来源:互联网公开数据
标签:信贷风险, 违约预测, 用户画像, 机器学习, 数据分析, 金融风控, 风险评估, 结构化数据
数据概述:
该数据集包含用户信贷相关数据,用于预测用户是否会发生信贷违约。主要特征如下:
时间跨度:数据未明确标明时间范围,可视为静态数据集,反映用户某一时间点的信贷状态。
地理范围:数据未限制地理范围,推测可能来源于特定信贷机构或平台。
数据维度:数据集包含多个CSV文件,主要数据项包括:
train.csv: 包含用户ID、多个匿名特征(pc0-pc16)和标签label(表示是否违约)。
test.csv: 包含用户ID和匿名特征(pc0-pc16),用于预测。
non_borrower_user.csv: 包含用户ID和匿名特征(pc0-pc16),可能代表未借款用户。
loan_activities.csv: 包含用户ID、联系人信息、贷款类型和时间戳等信息。
sample_submission.csv: 提交样本,包含用户ID和预测的违约概率。
数据格式:CSV格式,便于数据分析和模型训练。
来源信息:数据集来源于Ristek-Datathon-2024,已进行匿名化处理。
该数据集适合用于信贷风险预测、用户信用评估等领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融科技、信用评分、风险管理等领域的学术研究,例如构建信用风险预测模型、探索用户特征与违约之间的关系。
行业应用:为金融机构、信贷平台提供数据支持,用于提升信贷审批效率、优化风险控制策略、降低坏账率。
决策支持:支持信贷机构的决策制定,辅助进行用户信用评估、贷款额度确定、风险定价等。
教育和培训:作为金融风控、机器学习课程的实训素材,帮助学生和研究人员掌握信贷风险建模方法。
此数据集特别适合用于构建和评估信贷违约预测模型,帮助用户优化风险管理策略,提升信贷业务的盈利能力。