标题:泰坦尼克号乘客数据分析集
数据内容:
该数据集包含了泰坦尼克号沉船事件中乘客的详细信息,包括乘客ID、生存情况、舱位等级、姓名、性别、年龄、兄弟姐妹/配偶数量、父母/子女数量、船票信息、票价、舱位信息以及登船港口等字段。每个字段的具体统计信息如下:
- PassengerId: 891种不同值,表示每位乘客的唯一标识。
- Survived: 2种不同值(0表示未幸存,1表示幸存),表示乘客是否在沉船事件中幸存。
- Pclass: 3种不同值(1、2、3),表示乘客的舱位等级。
- Name: 891种不同值,表示乘客的姓名。
- Sex: 2种不同值(male、female),表示乘客的性别。
- Age: 89种不同值,表示乘客的年龄。
- SibSp: 7种不同值,表示乘客的兄弟姐妹/配偶数量。
- Parch: 7种不同值,表示乘客的父母/子女数量。
- Ticket: 681种不同值,表示乘客的船票信息。
- Fare: 248种不同值,表示乘客的票价。
- Cabin: 148种不同值,表示乘客的舱位信息。
- Embarked: 4种不同值(C、Q、S、N/A),表示乘客的登船港口。
数据来源:互联网公开数据
数据用途:
该数据集主要用于分析乘客的生存率与各种特征之间的关系,适用于以下行业的相关问题:
- 市场营销:研究不同舱位等级乘客的消费行为差异。
- 物流运输:分析乘客分布与票价之间的关系,优化票价策略。
- 应急管理:研究不同性别、年龄、家庭成员数量等因素对生存率的影响,为应急救援提供参考。
- 数据科学:作为经典数据集,用于机器学习模型的训练与验证,如分类模型的构建与评估。
标签:泰坦尼克号, 乘客数据, 生存预测, 机器学习, 数据分析
行业分类:
- 市场营销
- 物流运输
- 应急管理
- 数据科学