纽约市2017年出租车行程数据集

纽约市2017年出租车行程数据集 数据来源:互联网公开数据
标签:出租车,纽约市,交通出行,时间序列,数据分析,城市规划,经济分析

数据概述
本数据集包含2017年纽约市出租车行程的详细记录,数据由纽约市出租车及豪华轿车委员会(TLC)收集并由纽约市政府通过其“NYC Open Data”项目公开发布。为了提高数据分析效率并缩短运行时间,数据集从原始的1.13亿条记录中抽取了部分样本。数据字段涵盖了每笔行程的关键信息,包括行程编号、供应商标识、上下车时间、乘客数量、行驶距离、费用详情等,为研究纽约市出租车出行模式、交通流量和经济活动提供了丰富的依据。

数据用途概述
该数据集适用于多种场景:
1. 交通出行分析:研究人员可以利用时间序列数据,分析出租车出行的季节性特征、高峰期分布以及不同区域的出行需求。
2. 城市规划与政策制定:城市规划者可基于数据识别交通拥堵区域,优化公共交通资源配置;政策制定者可以评估交通政策对出租车行业的影响。
3. 经济研究:数据中的费用信息(如车费、小费、税费等)可用于分析出租车行业的经济结构,研究税率调整对收入的影响。
4. 商业应用:企业可以利用数据预测市场需求,优化出租车调度策略,提高运营效率。
5. 学术研究:数据集支持多种研究方向,如出行行为分析、城市经济学、数据挖掘等,适合学者开展实证研究。

数据字段定义
以下是数据集中主要字段的描述:

  • ID:每笔行程的唯一标识编号。
  • VendorID:记录提供者标识码,具体含义如下:
  • 1:Creative Mobile Technologies, LLC
  • 2:VeriFone Inc.
  • tpep_pickup_datetime:出租车计价器启动的时间,即乘客上车时间。
  • tpep_dropoff_datetime:出租车计价器关闭的时间,即乘客下车时间。
  • Passenger_count:车内乘客数量,由司机填写。
  • Trip_distance:计价器记录的行程距离(单位:英里)。
  • PULocationID:乘客上车时所在的TLC出租车分区。
  • DOLocationID:乘客下车时所在的TLC出租车分区。
  • RateCodeID:行程结束时生效的费率代码,具体含义如下:
  • 1:标准费率
  • 2:JFK机场费率
  • 3:纽瓦克机场费率
  • 4:拿骚或威斯特彻斯特费率
  • 5:协商费率
  • 6:拼车费率
  • Store_and_fwd_flag:标记该行程记录是否存储在车辆内存中,即“存储转发”(Store and Forward):
  • Y:存储转发行程
  • N:非存储转发行程
  • Payment_type:乘客支付方式的标识码,具体含义如下:
  • 1:信用卡
  • 2:现金
  • 3:无收费
  • 4:争议
  • 5:未知
  • 6:无效行程
  • Fare_amount:计价器计算的车费。
  • Extra:额外费用和附加费,包括高峰时段和夜间附加费($0.50或$1)。
  • MTA_tax:每笔行程自动触发的$0.50 MTA税。
  • Improvement_surcharge:自2015年起开始征收的$0.30改善附加费。
  • Tip_amount:小费金额,信用卡支付的小费会自动记录,现金支付的小费不包含在内。
  • Tolls_amount:行程中支付的所有过桥费总额。
  • Total_amount:乘客支付的总金额,不包括现金支付的小费。

数据特征
- 数据时间范围:2017年全年。
- 数据样本量:原始数据包含约1.13亿条记录,本数据集为抽样数据。
- 数据维度:包含多个字段,涵盖行程的基本信息、费用细节和上下车位置等。
- 数据格式:CSV格式,字段清晰,易于处理。

数据价值
该数据集具有较高的实用性和研究价值,能够帮助用户深入理解纽约市出租车行业的运营状况、乘客出行行为以及城市交通的动态变化。无论是学术研究还是实际应用,数据集均提供了丰富的信息支持,适用于多种分析需求。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.64 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。