数据概述:
本数据集收集了两类酒店(城市酒店与度假酒店)的预订行为数据,涵盖了客户预订时间、入住时长、随行人数、停车需求等多个维度。数据可用于分析客户预订习惯、预测入住需求、评估取消率等。所有涉及个人身份的信息均已删除,确保数据可公开使用。数据源来自经同行评审的研究文章,具备较高的研究参考价值。
字段说明(常见字段包括但不限于):
hotel:酒店类型(“City Hotel”或“Resort Hotel”)
is_canceled:是否取消预订(1=是,0=否)
lead_time:从预订到入住之间的天数
arrival_date_year / month / day:计划到达的年份、月份、日期
stays_in_weekend_nights:周末夜晚的入住时长
stays_in_week_nights:工作日夜晚的入住时长
adults:成年住客人数
children:儿童住客人数
babies:婴儿数量
meal:所选餐食类型
country:客户来源国家代码
reserved_room_type / assigned_room_type:预订与实际分配的房型
booking_changes:预订修改次数
deposit_type:押金类型(如“Non Refund”, “Refundable”)
customer_type:客户类型(如“Transient”, “Group”)
required_car_parking_spaces:所需停车位数量
total_of_special_requests:特殊需求数量
数据格式:
表格型结构,常用格式为 CSV,适用于主流数据分析与建模工具。
时间范围:
数据覆盖多个完整年度的酒店预订记录,具体时间可根据数据字段进一步确认。
更新频率:
静态历史数据集,不定期更新,适用于一次性分析和建模任务。
适用场景:
酒店预订行为分析
取消率预测模型开发
客户群体画像分析
需求预测与资源配置优化
酒店运营管理与市场策略制定
数据来源:
原始数据来自发表在 Data in Brief(2019年2月,第22卷)的研究文章《Hotel Booking Demand Datasets》,作者包括 Nuno Antonio、Ana Almeida 和 Luis Nunes。数据中所含姓名、邮箱、电话及信用卡信息为合成内容,非真实用户信息。