GTFS公交交通预测数据集
数据来源:互联网公开数据
标签:公交交通,GTFS,交通预测, Pune,公共交通,速度分析,交通拥堵
数据概述:
本数据集来源于 Pune Mahanagar Parivahan Mahamandal Limited,涵盖了2019年Pune市一天的公交运输数据。数据集包含366条路线、5624个站点和21,804个行程记录。数据集经过作者整理,通过显式推导多个参数和属性,分为4个不同的类别,并使用SRI(速度降低指数)进行分类,最终将庞大的数据集(包含9个CSV文件)整合为一个包含关键信息的文件。
数据用途概述:
该数据集适用于公交交通预测、交通拥堵分析、公共交通规划等多种场景。研究人员可以利用此数据进行公交线路和站点的优化分析;交通管理部门可以借助数据识别交通拥堵点,制定相应的交通管理策略;城市规划者可以利用数据评估公交系统整体效率并进行改善;此外,数据集也适合用于教育培训,帮助学习者理解公交交通系统的运作规律。
字段定义:
- stop id from:出发站点或车站的唯一标识编号。
- stop id to:目的地站点或车站的唯一标识编号。
- trip id:特定行程或公交车的唯一标识。
- arrival time:公交车到达某个站点的时间。如未明确提及,则用作出发时间。
- time:连续两个站点之间的行程时间。根据相邻两个站点的到达时间计算得出。
- speed:通过相邻两个站点之间的距离与时间的比值计算得出。距离使用Haversine公式根据站点的经纬度坐标计算得到。
- number of trips:在特定时间段内,两个特定站点之间行驶的公交车总数。
- SRI或速度降低指数:相对于交通拥堵和自由流动的相对速度比值。
- Degree of congestion labels:根据SRI值将每个数据条目分类为非常顺畅、顺畅、轻度拥堵和重度拥堵。分类标准如下:
| SRI | Degree of Congestion |
| 负值 | 非常顺畅 |
| 0-2.5 | 顺畅 |
| 2.5-5.0 | 轻度拥堵 |
| 大于5.0 | 重度拥堵 |
时间间隔:
数据集使用了以下时间间隔进行整理:
- 9:00-9:20 A.M
- 2:00-2:20 P.M
- 6:00-6:20 P.M
这些时间间隔的选择为数据处理提供了更简洁和方便的方法。