信贷风险预测特征工程数据集CreditRiskPredictionFeatureEngineeringDataset-raphaelpguimaraes

信贷风险预测特征工程数据集CreditRiskPredictionFeatureEngineeringDataset-raphaelpguimaraes

数据来源:互联网公开数据

标签:信贷风险, 信用评分, 机器学习, 特征工程, 风险评估, 贷款违约, 客户画像, 数据建模

数据概述: 该数据集包含从信贷申请人数据中提取的特征,以及对应的信贷风险标签,用于构建信贷风险预测模型。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态数据集。 地理范围:数据来源未明确,但特征内容涵盖了信贷相关的常见指标,具有一定的通用性。 数据维度:数据集包含两部分关键数据: features_43.csv:包含多个数值型特征,如收入、信用额度、年金、商品价格、人口统计信息、工作时长等,以及经过特征工程处理后的衍生特征,如信用收入比、年金收入比、多项式特征等。 labels_train.csv:包含目标变量“TARGET”,表示信贷风险,通常0代表未违约,1代表违约。 数据格式:数据以CSV格式存储,方便数据分析和模型训练。此外,还包含使用pickle格式存储的训练好的模型和特征工程相关文件。 来源信息:数据来源于信贷风险预测相关项目,已进行特征提取和初步处理。 该数据集适合用于信贷风险预测模型的构建、特征重要性分析以及模型优化。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于信贷风险评估、违约预测等领域的学术研究,如特征选择方法对比、模型评估指标分析等。 行业应用:为金融机构提供数据支持,可应用于信贷审批、风险管理、客户细分等业务场景。 决策支持:支持信贷决策的制定和风险控制策略的优化。 教育和培训:作为机器学习、数据挖掘等课程的实训素材,帮助学生理解信贷风险预测流程和技术。 此数据集特别适合用于探索不同特征对信贷风险的影响,并构建预测模型,以提高信贷决策的准确性和效率。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 115.63 MiB
最后更新 2025年5月30日
创建于 2025年5月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。