Cyclistic共享单车骑行数据清洗数据集-2020年1月至2021年9月
数据来源:互联网公开数据
标签:共享单车,骑行数据,数据清洗,芝加哥,Cyclistic,时间序列,交通出行,数据分析
数据概述:
本数据集是经过预处理的Cyclistic共享单车骑行数据,用于数据分析。原始数据经过以下清洗:
1.  移除重复的骑行ID(重复骑行记录的开始/结束时间不一致)。
2.  删除包含空值的所有行(站点名称、ID和坐标存在空值)。
3.  修正站点名称中的拼写错误和不一致之处。
4.  删除不一致的站点ID并创建新的ID。
5.  移除用于仓储和维护的骑行记录。
6.  删除开始和结束日期不合理的骑行记录(部分骑行结束时间早于开始时间)。
数据集包含:
1.  2020年1月至2021年9月的完整清洗数据集,共13个月数据。
2.  2020年10月至2021年9月的完整清洗数据集,共12个月数据。
3.  2020年10月至2021年9月的清洗数据集(仅包含开始/结束站点ID,不包含站点信息),共7个月数据。
4.  包含每个站点信息的2个数据集。
数据由Motivate International Inc.授权。
数据用途概述:
该数据集适用于骑行行为分析、用户画像研究、骑行模式识别、市场营销策略制定等多种场景。研究人员可用于分析骑行时长、路线、用户类型等因素对骑行需求的影响;市场人员可用于制定针对性的营销活动;城市规划者可用于优化共享单车站点布局。