实验室论文分享┆ST-RetNet:一种时空交通流长时预测方法

本推文详细介绍了一篇实验室的最新论文《ST-RetNet: A Long-term Spatial-Temporal Traffic Flow Prediction Method》,该论文已被第七届中国模式识别与计算机视觉大会(The 7th Chinese Conference on Pattern Recognition and Computer Vision, PRCV 2024)接收。该论文的第一作者为龙佰超。交通流量预测在智能交通系统领域中被认为是一项关键任务。本文旨在解决交通时空大数据预测的精度随着预测时间的延长会出现预测精度下降的问题,提出了一种新模型,称为时空保留网络(Spatial-Temporal Retentive Network,ST-RetNet)。通过在四个真实世界数据集上的实验比较,论文证明了ST-RetNet在交通流量预测方面优于现有的基线模型。本推文由龙佰超撰写,审校为李杨和陆新颖。

原文链接:https://arxiv.org/pdf/2407.11074

第七届中国模式识别与计算机视觉大会 (The 7th Chinese Conference on Pattern Recognition and Computer Vision, PRCV 2024) 将于2024年10月18日至20日在乌鲁木齐举行。PRCV 2024由中国自动化学会 (CAA)、中国图象图形学学会 (CSIG)、中国人工智能学会 (CAAI) 和中国计算机学会 (CCF) 联合主办,新疆大学承办,是国内顶级的模式识别和计算机视觉领域学术盛会,并且是CCF C类会议。本届会议旨在汇聚国内外模式识别和计算机视觉领域的广大科研工作者及工业界同行,分享最新理论研究进展和技术研发成果。通过此次会议,能够加强本领域学术界和企业界的深入交流与合作,从而进一步促进模式识别与计算机视觉领域的协同创新。会议邀请到谭铁牛院士、王耀南院士、马毅、Sato Yoichi等专家做大会报告,另外还有4个主旨报告、8个邀请报告、9个专题论坛、30个应用展示、6个前沿讲习班、7项竞赛获奖交流、女科学家论坛、博士生论坛、录用论文口头报告和墙报等精彩内容。

1.研究背景及主要贡献

准确且实时的交通流量预测对于城市发展和自动驾驶至关重要。由于交通流量存在复杂的时空依赖关系,传统基于循环神经网络(Recurrent Neural Networks, RNNs)和图神经网络(Graph Neural Networks, GNNs)的方法已无法满足需求,交通流量预测仍是一项挑战。Transformer的出现引入了自注意力机制,提高了计算效率,并在交通流量预测中取得了显著成果。然而,RNNs在长期预测中的准确性不足。论文提出了一种新模型——时空保留网络(ST-RetNet),解决了基于图卷积神经网络(Graph Convolutional Networks, GCNs)和RNNs的长序列预测中准确性低的问题。论文扩展了RetNet,应用于交通流量预测任务,在时间和空间层面实现更好的性能。在空间层面,S-RetNet结合了拓扑图结构和自适应邻接矩阵,提取动态和静态空间特征。在时间层面,T-RetNet有效捕捉了长期依赖关系。通过在四个真实交通数据集上的实验比较,ST-RetNet在交通流量预测方面优于现有基线模型。本文的主要贡献如下:

(1)成功将RetNet应用于交通流量预测,展示了其适用性。

(2)提出了时空模型ST-RetNet,综合实验表明其优于现有模型。

(3)引入自适应邻接矩阵和GCN,增强了空间特征提取。

(4)T-RetNet在多步交通流量预测中表现出色,尤其在长期预测方面。

2.方法

图1 ST-RetNet的框架

如图 1所示,ST-RetNet首先对输入特征向量进行维度扩展。这一步有助于提取更多有用的特征信息,从而提升网络后续层的性能。扩展后的特征向量进入堆叠的时空块,以进行时空特征提取。本部分综合利用了RetNet、GCNs模型、残差连接和门控机制等概念,全面捕捉时空特征。最后,提取的特征被传递到预测层,生成交通流预测结果。

(1)S-RetNet

S-RetNet 的创新之处在于其结合了GCNs和自适应邻接矩阵,以全面捕捉道路网络的动态和静态空间特征。GCNs 基于道路网络中传感器的已知空间关系,有效地捕捉了道路网络的静态空间特征。通过前向传递矩阵和后向传递矩阵,考虑了传感器之间的距离和方向关系,从而确保捕捉到传感器之间的静态相关性。自适应邻接矩阵无需先验知识,通过模型的学习过程自动学习传感器数据之间的动态空间依赖性。通过初始化可学习的列向量,生成的自适应邻接矩阵能够反映传感器之间的动态空间依赖性。通过引入空间保留机制,模型能够利用相对位置嵌入的方法,更好地捕捉输入序列中的复杂关系和有用信息。多尺度空间保留机制对输入序列进行多尺度分析,并通过门结构增强模型的非线性,从而提高特征提取的准确性。

(2)T-RetNet

在时间维度上的创新点主要体现在其时间保留机制、多尺度时间保留和前馈网络的设计上。引入了结合因果掩码和随相对距离指数衰减的矩阵,用以捕捉时间序列数据中的长期依赖关系。这一机制确保了在处理长时间序列数据时,能够有效地捕捉时间相关性。为了更好地捕捉输入序列中的复杂关系和有用信息,T-RetNet 使用多尺度时间保留方法。输入序列在多个尺度上进行分析,多尺度计算结果通过门结构增加模型的非线性,从而综合捕捉时间依赖性。前馈网络的设计与 S-RetNet 类似,通过对多尺度保留结果进行线性和非线性变换,最终得到 T-RetNet 的输出,从而提高模型的整体性能。

3.实验

(1)实验细节

实验使用的四个公开数据集包括PEMS03、PEMS04、PEMS07和PEMS08。在Windows平台上进行实验(CPU: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz;GPU: NVIDIA GeForce RTX 2080)。数据集按3:1:1的比例分为训练集、测试集和验证集。使用前一小时的历史数据预测下一小时的交通状况。模型采用RMSprop优化器,学习率为0.001,批量大小为32,最大训练轮数为200。实验选择了三个评价指标:平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Mean Absolute Percentage Error ,MAPE)和均方根误差(Root Mean Square Error, RMSE)。

(2)实验结果

S-RetNet与GCN方法的比较:如图 2所示S-RetNet
在捕捉动态空间特征方面优于基于GCN的方法。在四个数据集上的实验结果显示,S-RetNet 在中长期预测中表现更稳定,预测精度更高。

图2 S-RetNet与GCN的性能比较

T-RetNet与时间模型的比较:如图3所示T-RetNet在捕捉长期依赖关系方面优于其他时间模型,包括RNN、长短期记忆网络(Long Short Term Memory networks, LSTM)、门控循环单元(Gated Recurrent Unit, GRU)和Transformer。在所有数据集上,T-RetNet的MAE增长缓慢,预测性能优于其他时间模型。

图3 T-RetNet与时序模型的性能比较

ST-RetNet与基线模型的比较:如表1所示,ST-RetNet在四个数据集上的表现均优于现有的基线模型,特别是在中长期预测方面具有显著优势。

表1 ST-RetNet与其他基准模型的性能比较

消融实验:如表 2所示消融实验验证了 ST-RetNet 模型中各模块的必要性。具体实验包括移除 S-RetNet、T-RetNet 和 GCNs 组件,并对比它们对模型性能的影响。

表2 消融实验

4.结论

论文提出了一种新的用于交通流量预测的时空保留网络(ST-RetNet),该网络具有较高的预测精度和长期预测能力。论文引入了RetNet 的思想,并将其扩展到时间和空间两个尺度的建模,在保证并行计算的同时,提升了整体性能。ST-RetNet 通过结合时间尺度的T-RetNet和空间尺度的S-RetNet实现对时空特征的全面捕捉。论文在四个真实数据集上对 ST-RetNet进行了测试,结果表明,与现有的最先进方法相比,论文所提出模型在交通流量预测方面表现出更强的竞争力,验证了ST-RetNet在捕获时空依赖关系方面的有效性。未来,可进一步探索使用多模态数据来改进交通流量预测模型的性能,并研究如何基于现有的大语言模型对交通流量的时空特征进行建模。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-20 03:28:01       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-20 03:28:01       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-20 03:28:01       45 阅读
  4. Python语言-面向对象

    2024-07-20 03:28:01       55 阅读

热门阅读

  1. 关于Flutter的build

    2024-07-20 03:28:01       14 阅读
  2. codeforces错题

    2024-07-20 03:28:01       19 阅读
  3. 如何基于 Apache SeaTunnel 同步数据到 Iceberg

    2024-07-20 03:28:01       19 阅读
  4. # Vue.js 3: 探索响应式原理与组合式 API

    2024-07-20 03:28:01       17 阅读
  5. 聚类标签的艺术:Scikit-Learn中的转换技术

    2024-07-20 03:28:01       18 阅读
  6. Go语言并发编程-案例_3

    2024-07-20 03:28:01       19 阅读
  7. 数据的守护者:深入解析 Elasticsearch 的副本机制

    2024-07-20 03:28:01       18 阅读
  8. Linux C++ 058-设计模式之解释器模式

    2024-07-20 03:28:01       20 阅读