泰坦尼克号乘客数据分析集

标题:泰坦尼克号乘客数据分析集

数据内容: 该数据集包含了泰坦尼克号沉船事件中乘客的详细信息,包括乘客ID、生存情况、舱位等级、姓名、性别、年龄、兄弟姐妹/配偶数量、父母/子女数量、船票信息、票价、舱位信息以及登船港口等字段。每个字段的具体统计信息如下: - PassengerId: 891种不同值,表示每位乘客的唯一标识。 - Survived: 2种不同值(0表示未幸存,1表示幸存),表示乘客是否在沉船事件中幸存。 - Pclass: 3种不同值(1、2、3),表示乘客的舱位等级。 - Name: 891种不同值,表示乘客的姓名。 - Sex: 2种不同值(male、female),表示乘客的性别。 - Age: 89种不同值,表示乘客的年龄。 - SibSp: 7种不同值,表示乘客的兄弟姐妹/配偶数量。 - Parch: 7种不同值,表示乘客的父母/子女数量。 - Ticket: 681种不同值,表示乘客的船票信息。 - Fare: 248种不同值,表示乘客的票价。 - Cabin: 148种不同值,表示乘客的舱位信息。 - Embarked: 4种不同值(C、Q、S、N/A),表示乘客的登船港口。

数据来源:互联网公开数据

数据用途: 该数据集主要用于分析乘客的生存率与各种特征之间的关系,适用于以下行业的相关问题: - 市场营销:研究不同舱位等级乘客的消费行为差异。 - 物流运输:分析乘客分布与票价之间的关系,优化票价策略。 - 应急管理:研究不同性别、年龄、家庭成员数量等因素对生存率的影响,为应急救援提供参考。 - 数据科学:作为经典数据集,用于机器学习模型的训练与验证,如分类模型的构建与评估。

标签:泰坦尼克号, 乘客数据, 生存预测, 机器学习, 数据分析

行业分类: - 市场营销 - 物流运输 - 应急管理 - 数据科学

packageimg

数据与资源

附加信息

字段
版本 1
数据集大小 0.06 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。