2022年11月AnalyticsVidhya保险索赔预测数据集-avikumart
数据来源:互联网公开数据
标签:保险索赔,政策持有人,车辆信息,数据分析,预测模型,机器学习,保险,汽车,城市密度,F1分数
数据概述:
本数据集包含政策持有人的详细信息,包括政策期限、车辆年龄、车主年龄、城市人口密度、车辆品牌和型号、发动机功率等属性,以及目标变量,即政策持有人在未来6个月内是否提交索赔。数据集分为三个文件,分别为train.csv、test.csv和sample_submission.csv。train.csv文件用于训练模型,test.csv文件用于模型测试,sample_submission.csv文件为提交结果的模板。
数据集中的关键字段包括:
- policy_id: 政策持有人的唯一标识符
- policy_tenure: 政策持续时间
- age_of_car: 车辆的标准化年龄(年)
- age_of_policyholder: 政策持有人的标准化年龄(年)
- area_cluster: 政策持有人所在区域集群
- population_density: 政策持有人所在城市的密度
- make: 车辆制造公司(编码)
- segment: 车辆类型(A/B1/B2/C1/C2)
- model: 车辆型号(编码)
- fuel_type: 车辆使用的燃料类型
- max_torque: 车辆最大扭矩(Nm@rpm)
- max_power: 车辆最大功率(bhp@rpm)
- engine_type: 车辆使用的发动机类型
- airbags: 车辆安装的气囊数量
- is_esc: 汽车是否安装有电子稳定控制系统(ESC)
- is_adjustable_steering: 汽车的方向盘是否可调
- is_tpms: 汽车是否安装有胎压监测系统(TPMS)
- is_parking_sensors: 汽车是否安装有倒车雷达
- is_parking_camera: 汽车是否安装有倒车摄像头
- rear_brakes_type: 汽车后轮刹车类型
- displacement: 发动机排量(cc)
- cylinder: 发动机气缸数
- transmission_type: 变速器类型
- gear_box: 挡位数
- steering_type: 助力转向类型
- turning_radius: 车辆转弯所需的空间(米)
- length: 车辆长度(毫米)
- width: 车辆宽度(毫米)
- height: 车辆高度(毫米)
- gross_weight: 满载时汽车的最大允许重量(包括乘客、货物和设备,单位:千克)
- is_front_fog_lights: 汽车是否配有前雾灯
- is_rear_window_wiper: 汽车是否配有后窗雨刷
- is_rear_window_washer: 汽车是否配有后窗清洗器
- is_rear_window_defogger: 汽车是否配有后窗除雾器
- is_brake_assist: 汽车是否配有制动辅助系统
- is_power_door_lock: 汽车是否配有电动门锁
- is_central_locking: 汽车是否配有中央门锁
- is_power_steering: 汽车是否配有助力转向系统
- is_driver_seat_height_adjustable: 汽车是否配有可调节驾驶员座椅
- is_day_night_rear_view_mirror: 汽车是否配有昼夜后视镜
- is_ecw: 汽车是否配有发动机检查警告(ECW)
- is_speed_alert: 汽车是否配有超速警告系统
- ncap_rating: 车辆安全评级(满分5分)
- is_claim: 目标变量,汽车是否在未来6个月内提交索赔
数据用途概述:
该数据集适用于保险索赔预测、车辆特征分析、客户行为研究等多个场景。保险公司可以利用此数据构建预测模型,以评估潜在的索赔风险,优化保险产品设计,提高客户服务质量和运营效率。数据科学家也可以使用这些数据进行机器学习模型的训练和验证,以提高预测精度和模型性能。此外,该数据集还适合用于教育和研究,帮助学习者更好地理解保险行业中的数据分析方法和应用。