保险索赔预测数据集-2021年9月TabularPlaygroundSeries竞赛

保险索赔预测数据集-2021年9月TabularPlaygroundSeries竞赛 数据来源:互联网公开数据 标签:保险,索赔,预测,机器学习,竞赛,表格数据,匿名特征,CTGAN,二元分类 数据概述: 本数据集源于Kaggle平台2021年9月举办的Tabular Playground Series竞赛,用于预测保险索赔。数据集是合成的,基于真实数据集,并使用CTGAN生成。原始数据集涉及预测保险单是否会提出索赔。尽管特征经过匿名处理,但它们具有与现实世界特征相关的属性。

数据包含了用于预测客户是否会提出保险索赔的匿名特征。目标变量是二元值,表示是否提出索赔。预测结果的范围是0.0到1.0,代表索赔的概率。数据集中的特征经过匿名化处理,可能包含缺失值。

数据用途概述: 该数据集适用于机器学习模型的训练和评估,特别是二元分类问题。研究人员可以使用此数据进行模型构建,探索特征工程,优化预测性能。该数据集也适合于教学和研究,用于演示和实践表格数据的处理、特征分析、模型选择和超参数调优等流程。此外,该数据集可用于探索生成对抗网络(GAN)在生成合成数据集中的应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 587.51 MiB
最后更新 2025年5月30日
创建于 2025年5月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。