泰坦尼克号灾难预测数据集

泰坦尼克号灾难预测数据集 数据来源:互联网公开数据 标签:泰坦尼克号,灾难预测,机器学习,二分类,生存预测,数据预处理,特征工程

数据概述: 泰坦尼克号灾难预测数据集是一个著名的机器学习二分类问题入门数据集,来源于泰坦尼克号乘客名单,提供了船上个体乘客的信息。该数据集的目标是根据乘客的属性预测其生存的可能性。

数据集包含以下特征: - PassengerId:每位乘客的唯一标识符。 - Survived:目标变量(0 = 未生存,1 = 生存)。 - Pclass:乘客舱位等级(1 = 一等舱,2 = 二等舱,3 = 三等舱)。 - Name:乘客姓名,可能包含头衔等信息。 - Sex:乘客性别。 - Age:乘客年龄。 - SibSp:船上的兄弟姐妹和配偶数量。 - Parch:船上的父母和子女数量。 - Ticket:船票号(有时可揭示群体信息)。 - Fare:船票费用。 - Cabin:客舱号(通常不完整)。 - Embarked:登船港口(C = 赤港,Q = 皇后镇,S = 南安普顿)。

数据集分为两部分: - train.csv:包含用于模型训练的特征及生存状态。 - test.csv:包含用于预测的特征,但不包含生存状态。

该数据集适用于学习数据预处理、特征工程和预测建模等基础技能。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 04:40 (UTC)
创建于 四月 15, 2025, 04:40 (UTC)