信贷风险评估数据集CreditRiskAssessmentDataset-hossamahmedfahmy

信贷风险评估数据集CreditRiskAssessmentDataset-hossamahmedfahmy

数据来源:互联网公开数据

标签:信贷风险, 信用评分, 违约预测, 贷款申请, 客户画像, 机器学习, 数据分析, 金融风控

数据概述: 该数据集包含信贷申请人的相关信息,用于评估其信用风险。主要特征如下: 时间跨度:数据未明确具体时间范围,可视为一段时间内的客户申请数据。 地理范围:数据未限定特定地区,可能来源于多个地区的信贷申请。 数据维度:数据集包含多个维度的数据,包括申请人的基本信息、收入情况、贷款信息、家庭情况、联系方式、社会环境、历史信用记录等。具体字段包括:TARGET(目标变量,表示是否违约)、NAME_CONTRACT_TYPE(贷款类型)、CODE_GENDER(性别)、FLAG_OWN_CAR(是否有车)、FLAG_OWN_REALTY(是否有房产)、CNT_CHILDREN(子女数量)、AMT_INCOME_TOTAL(总收入)、AMT_CREDIT(贷款额度)、AMT_ANNUITY(年金)、AMT_GOODS_PRICE(商品价格)、NAME_TYPE_SUITE(伴随者类型)、NAME_INCOME_TYPE(收入类型)、NAME_EDUCATION_TYPE(教育程度)、NAME_FAMILY_STATUS(家庭状况)、NAME_HOUSING_TYPE(住房类型)、REGION_POPULATION_RELATIVE(地区人口相对密度)、DAYS_REGISTRATION(注册天数)、DAYS_ID_PUBLISH(身份证发布天数)、FLAG_MOBIL(是否有手机)、FLAG_EMP_PHONE(是否有工作电话)、FLAG_WORK_PHONE(是否有工作电话)、FLAG_CONT_MOBILE(是否联系手机)、FLAG_PHONE(是否有电话)、FLAG_EMAIL(是否有邮箱)、CNT_FAM_MEMBERS(家庭成员数量)、REGION_RATING_CLIENT(地区客户评分)、REGION_RATING_CLIENT_W_CITY(含城市的地区客户评分)、WEEKDAY_APPR_PROCESS_START(申请开始的星期)、HOUR_APPR_PROCESS_START(申请开始的小时)、REG_REGION_NOT_LIVE_REGION(注册地区与居住地区是否相同)、REG_REGION_NOT_WORK_REGION(注册地区与工作地区是否相同)、LIVE_REGION_NOT_WORK_REGION(居住地区与工作地区是否相同)、REG_CITY_NOT_LIVE_CITY(注册城市与居住城市是否相同)、REG_CITY_NOT_WORK_CITY(注册城市与工作城市是否相同)、LIVE_CITY_NOT_WORK_CITY(居住城市与工作城市是否相同)、ORGANIZATION_TYPE(组织类型)、EXT_SOURCE_2(外部数据源2)、EXT_SOURCE_3(外部数据源3)、OBS_30_CNT_SOCIAL_CIRCLE(30天内观察到的社交圈人数)、DEF_30_CNT_SOCIAL_CIRCLE(30天内违约的社交圈人数)、OBS_60_CNT_SOCIAL_CIRCLE(60天内观察到的社交圈人数)、DEF_60_CNT_SOCIAL_CIRCLE(60天内违约的社交圈人数)、DAYS_LAST_PHONE_CHANGE(上次电话号码更改的天数)、FLAG_DOCUMENT_2(是否有文件2)、FLAG_DOCUMENT_3(是否有文件3)、FLAG_DOCUMENT_4(是否有文件4)、FLAG_DOCUMENT_5(是否有文件5)、FLAG_DOCUMENT_6(是否有文件6)、FLAG_DOCUMENT_7(是否有文件7)、FLAG_DOCUMENT_8(是否有文件8)、FLAG_DOCUMENT_9(是否有文件9)、FLAG_DOCUMENT_10(是否有文件10)、FLAG_DOCUMENT_11(是否有文件11)、FLAG_DOCUMENT_12(是否有文件12)、FLAG_DOCUMENT_13(是否有文件13)、FLAG_DOCUMENT_14(是否有文件14)、FLAG_DOCUMENT_15(是否有文件15)、FLAG_DOCUMENT_16(是否有文件16)、FLAG_DOCUMENT_17(是否有文件17)、FLAG_DOCUMENT_18(是否有文件18)、FLAG_DOCUMENT_19(是否有文件19)、FLAG_DOCUMENT_20(是否有文件20)、FLAG_DOCUMENT_21(是否有文件21)、AMT_REQ_CREDIT_BUREAU_HOUR(请求信用局的小时数)、AMT_REQ_CREDIT_BUREAU_DAY(请求信用局的天数)、AMT_REQ_CREDIT_BUREAU_WEEK(请求信用局的星期数)、AMT_REQ_CREDIT_BUREAU_MON(请求信用局的月数)、AMT_REQ_CREDIT_BUREAU_QRT(请求信用局的季度数)、AMT_REQ_CREDIT_BUREAU_YEAR(请求信用局的年数)、AGE(年龄)、YEARS_EMPLOYED(工作年限)。 数据格式:CSV 格式,文件名为Data_After_Cleaning.csv,便于数据分析与模型构建。 来源信息:数据经过清洗,可能已经过缺失值处理、异常值处理等预处理。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于信用风险评估、违约预测、客户细分等领域的学术研究,如信用评分模型、风险预警模型等。 行业应用:为金融机构、信贷公司提供数据支持,尤其适用于贷款审批、风险定价、客户管理等业务。 决策支持:支持信贷决策的制定,优化信贷策略,降低信贷风险。 教育和培训:作为金融风控、数据挖掘、机器学习等课程的实训材料,帮助学生和研究人员掌握相关技能。 此数据集特别适合用于构建信用评分模型,预测贷款违约概率,提升信贷业务的风险管理水平。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 04:21 (UTC)
创建于 五月 31, 2025, 04:21 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。