罗马公共交通ATAC公交车实时数据数据集-2023年9月6日至7日-mamiglia
数据来源:互联网公开数据
标签:公共交通,公交车,实时数据,GTFS,ATAC,罗马,交通运输,时间序列
数据概述:
本数据集包含了2023年9月6日下午14:00至9月7日下午17:00期间罗马公共交通系统(ATAC)公交车的实时运行数据。数据采用GTFS(通用交通馈送规范)格式,这是一种用于分发公共交通系统相关信息的开放标准。数据集主要由两部分组成:
静态数据(在 static.zip 文件中): 包含公交车的计划时刻表,例如线路、站点和预计到达时间等信息。
实时数据(在 realtime.zip 文件中): 包含每分钟更新的公交车实时位置和状态信息。
需要注意的是,ATAC公司的数据可能并非完全遵循GTFS标准,数据可能需要进行清洗和处理。例如,公交线路信息可能在calendar_dates.txt中以“例外运行”的形式呈现,而不是在calendar.txt中定义;部分数据可能存在时间倒退的情况;同一trip_id可能出现重复等问题。
数据采集方法:
实时数据通过脚本每分钟抓取一次,该脚本从ATAC的官方数据源获取数据,并将数据保存为CSV格式。由于数据源的限制,数据可能存在一定的时间间隔,特别是在凌晨4点到9点之间。
数据字段说明:
静态数据和实时数据均遵循GTFS标准,具体字段定义请参考GTFS规范文档。实时数据包括公交车的位置、速度、方向、延误情况等。
数据用途概述:
该数据集适用于多种研究和应用场景,例如:
交通流量分析: 分析公交车的运行状况,识别交通拥堵区域。
线路优化: 通过分析历史数据,优化公交车线路和时刻表。
乘客信息服务: 为乘客提供实时的公交车到达时间预测。
城市规划: 用于城市交通规划和基础设施建设。
学术研究: 研究交通运输系统的效率、可靠性以及对环境的影响。