纽约市出租车出行数据分析数据集NYCTaxiTripDataAnalysis-arlene025
数据来源:互联网公开数据
标签:出租车, 出行数据, 交通运输, 纽约市, 时空分析, 费用分析, 数据挖掘, 机器学习
数据概述:
该数据集包含来自纽约市的出租车出行记录,记录了2019年12月期间的出租车运营数据。主要特征如下:
时间跨度:数据记录的时间范围为2019年12月。
地理范围:数据覆盖纽约市行政区域内的出租车出行情况。
数据维度:数据集包括出租车出行相关的多个维度,如:
出租车供应商ID(VendorID)
上下车时间(tpep_pickup_datetime, tpep_dropoff_datetime)
乘客数量(passenger_count)
行驶距离(trip_distance)
车费相关信息(fare_amount, extra, mta_tax, tip_amount, tolls_amount, total_amount, congestion_surcharge)
上下车地点ID(PULocationID, DOLocationID)
支付方式(payment_type)
以及出租车区域信息(LocationID, Borough, Zone, service_zone)
数据格式:数据以CSV格式提供,包含两个文件:taxi-data.csv (出租车出行数据) 和 taxi_zones.csv (出租车区域信息)。
来源信息:数据来源于纽约市出租车与豪华轿车委员会 (TLC) 公开数据,已进行标准化处理。
该数据集适合用于交通运输分析、出行行为研究、城市规划以及出租车运营优化等领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于交通运输、城市规划、数据科学等领域的学术研究,如出行模式分析、交通流量预测、区域交通拥堵研究等。
行业应用:可以为出租车公司、共享出行平台提供数据支持,特别是在运营优化、定价策略、市场分析等方面。
决策支持:支持城市交通管理部门的决策制定,如交通信号优化、道路规划、公共交通与出租车协同发展等。
教育和培训:作为数据分析、数据挖掘、机器学习等课程的实训素材,帮助学生和研究人员深入理解交通运输领域的数据分析方法。
此数据集特别适合用于探索出租车出行的规律与趋势,如高峰时段、热门线路、费用构成等,从而帮助用户优化决策、提升效率。