基于移动窗口的LSTM神经网络的交通流量预测研究
鲁文敏 黄惠
昆明学院,云南昆明,650214
摘 要:随着城市化进程加快,交通流量预测的准确性与实时性需求日益迫切,针对交通流量的时间序列特性,本文提出一种基于长短期记忆网络(LSTM)的交通流量预测模型。通过整合交通流量、气象条件、时间特征等多维度数据,构建包含交通流量预测的数据集,并对数据进行标准化处理和序列构建。利用LSTM网络强大的时间序列处理能力,对未来交通流量进行预测。实验结果表明,该模型在训练和验证过程中表现稳定,在测试集上取得了较低的均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE),能够有效预测交通流量变化趋势。同时,与不使用滑动窗口的对比模型相比,使用滑动窗口构建数据集的模型优势显著,不使用滑动窗口的模型测试损失为0.0486,MSE高达188478.5781,RMSE为434.1412,MAE为249.4160。此外,通过对预测结果和原始数据的可视化分析,深入探讨了交通流量与各影响因素之间的关系,为交通管理和决策提供了有价值的参考依据。
关键词:交通流量预测;LSTM神经网络;时间序列分析;滑动窗口
1引言
随着城市化进程的加速,城市交通流量日益复杂,交通拥堵问题愈发严重。准确的交通流量预测对于交通管理、道路规划以及智能交通系统的发展至关重要。传统的交通流量预测方法,如时间序列分析、回归分析等,在处理非线性、复杂的交通流量数据时存在一定的局限性。近年来,深度学习技术在时间序列预测领域展现出强大的优势,尤其是长短期记忆网络(LSTM),能够有效捕捉时间序列中的长期依赖关系,在交通流量预测等领域得到了广泛应用 。本文旨在利用LSTM神经网络,结合多维度影响因素,构建高精度的交通流量预测模型,并通过全面的实验和可视化分析,验证模型的有效性,探索交通流量变化的内在规律。同时,对比使用滑动窗口和不使用滑动窗口构建数据集的模型性能差异,评估滑动窗口方法在交通流量预测中的重要性。
2 国内外研究现状
2.1传统预测方法研究进展
传统的交通流量预测方法主要包括参数模型和非参数模型。参数模型如自回归移动平均模型(ARIMA),通过建立时间序列的数学模型进行预测,但对非线性数据的适应性较差。非参数模型如支持向量机(SVM),在处理小样本数据时具有一定优势,但在处理大规模时间序列数据时效率较低。
2.2深度学习在交通流量预测中的应用
深度学习凭借其强大的特征提取和非线性映射能力,在交通流量预测中取得了显著成果。LSTM作为循环神经网络(RNN)的一种变体,通过引入门控机制解决了RNN中的梯度消失和梯度爆炸问题,能够更好地处理长序列数据,被广泛应用于交通流量预测 。已有研究表明,结合多源数据的LSTM模型能够进一步提高预测精度。同时,数据预处理方法如滑动窗口技术在时间序列数据处理中也发挥着重要作用,通过合理构建输入样本,可以增强模型对时间序列特征的学习能力。
3 模型构建与算法设计
3.1 LSTM单元结构
LSTM 单元通过门控机制实现对信息的选择性记忆与更新,其核心包含遗忘门、输入门、细胞状态更新及输出门四个关键计算步骤,这些步骤协同工作,使得模型能够有效捕捉交通流量时间序列中的长期依赖关系。
(一)遗忘门:信息筛选的 “过滤器”
在交通流量预测场景中,该公式用于确定历史信息的保留程度。代表 时刻遗忘门的输出,输出值介于 0 到 1 之间,在分析工作日与周末交通流量差异时,遗忘门会根据当前输入(包含时间、天气等特征) 和上一时刻隐藏状态(记录过去交通流量变化趋势),判断是否需要丢弃与当前预测无关的历史信息。 为 sigmoid 激活函数,将线性组合结果压缩至 0 - 1 区间;是遗忘门的权重矩阵,用于学习不同输入特征的重要性;为偏置项,增加模型拟合灵活性。
(二)输入门:新信息的 “把关人”
输入门公式由两部分组成。用于决定当前输入中哪些信息值得保留,其计算逻辑与遗忘门类似,输出值反映新信息的 “接纳概率”。当遇到突发天气变化时,输入门会提高与天气相关特征的权重,允许这些关键信息进入细胞状态。而为候选细胞状态,通过函数将输入特征映射到 -1 到 1 之间,形成待融合的新信息。、分别是输入门与候选细胞状态计算的权重矩阵,、为对应偏置项。
(三)细胞状态更新:长期记忆的 “载体升级”
细胞状态是 LSTM 实现长期记忆的核心。公式中,表示基于遗忘门输出,选择性保留上一时刻细胞状态中的历史信息;则将筛选后的新信息融入细胞状态。在预测节假日期间的交通流量时,细胞状态会保留过去节假日的交通模式信息,并结合当前实时数据(如天气、特殊事件)进行更新,从而实现对复杂交通规律的记忆与学习。
(四)输出门:预测信息的 “提炼者”
输出门首先通过计算细胞状态中哪些信息应被输出用于当前时刻的预测。在临近交通高峰时段,输出门会增强与高峰特征相关的信息权重。随后,将经过处理的细胞状态与输出门结果相乘,生成最终的隐藏状态。该隐藏状态既包含当前时刻的短期特征,也融合了细胞状态中的长期记忆,将作为下一时间步的输入或模型预测输出的基础。
3.2 LSTM 层架构与参数设定
模型采用双层堆叠的LSTM结构,每层设置64个隐藏单元。隐藏状态维度作为LSTM的核心超参数,其数值选择需平衡模型表征能力与过拟合风险:64个隐藏单元既能有效捕捉交通流量数据中的时空依赖特征,又可避免因模型复杂度过高导致的过拟合问题。该配置通过实验验证,在训练集与测试集误差指标上取得最优平衡。两层LSTM提取的高层特征通过张量重塑操作输入至全连接层。该输出层实现特征向量到标量预测值的映射,其数学表达为:
经过两层 LSTM 层提取的特征最终传递至全连接层。该层通过权重矩阵与偏置项,将高维特征向量映射为一维的交通流量预测值。在训练过程中,模型基于预测值与真实值的误差(如均方误差),通过反向传播算法优化和,使预测结果不断逼近实际交通流量,从而实现对未来交通状况的精准预估。
6 结论
通过对比实验验证了滑动窗口方法在交通流量预测中的显著优势。使用滑动窗口构建数据集的LSTM模型在训练和测试过程中表现出良好的性能,能够准确预测交通流量变化趋势,为交通管理和决策提供了有力支持。而不使用滑动窗口的模型性能较差,表明合理序列化时间数据能有效提升模型对动态交通模式的捕捉能力。通过可视化分析,模型揭示了交通流量与时间、气象等因素的强相关性,验证了多维度数据融合的必要性。
参考文献
[1]李正楠,赵智辉.结合GCN和LSTM考虑时空信息的城市交通流量预测[J].吉林大学学报(信息科学版),2025,43(01):187-194.
[2]崔金魁.(2024).基于深度学习和大数据分析的智慧交通流量预测模型研究.信息化研究,50(03),16-22.
[3]孙加新.基于深度学习的交通流量预测研究[D].长安大学,2023.
作者简介:
鲁文敏(2003.1-),女(汉族),本科,云南大理人,本科,研究方向:深度学习
黄惠(2003.1-),女(土家族),本科,湖南保靖人,本科,研究方向:机器学习
课题信息:
2023年云南省大学生创新创业训练计划(项目编号S202311393028)