泰坦尼克号乘客生存预测贝叶斯聚类分析数据集-2022年7月

泰坦尼克号乘客生存预测贝叶斯聚类分析数据集-2022年7月 数据来源:互联网公开数据 标签:泰坦尼克号,生存预测,贝叶斯聚类,机器学习,数据分析,聚类,预测,Kaggle

数据概述: 本数据集包含了基于贝叶斯高斯混合模型(Bayesian Gaussian Mixture Models, BGMM)对泰坦尼克号乘客生存情况的聚类预测结果。这些预测结果基于作者在Kaggle平台上发布的notebook的第五个版本生成,该notebook用于分析泰坦尼克号乘客的数据,并预测他们的生存概率。数据集使用了7个聚类簇,并进行了100次不同的随机种子(seed)的预测,以增强结果的鲁棒性。

数据用途概述: 该数据集适用于机器学习模型评估、聚类算法研究、泰坦尼克号乘客生存分析等多种场景。研究人员可以利用此数据评估贝叶斯聚类模型在生存预测问题上的表现;可以用来分析不同聚类簇的特征,从而深入理解影响乘客生存的关键因素;也可以作为教学案例,帮助学习者理解聚类分析在实际问题中的应用。此外,数据集也为Kaggle竞赛参与者提供了额外的分析视角。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.41 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。