复杂场景下超大规模轨交线网智能短时客流预测
黄颖 陶睿涵 王伟佳 师蓓悦
上海工程技术大学 上海市 201620
1. 引言
城市轨道交通以其快速、安全、高效的优势,已成为城市居民出现的核心选择,是现代城市交通的核心组成部分,在缓解交通拥堵、提升出行效率方面发挥着不可替代的作用。然而,随着城市化进程的加速和人口的持续增长,轨交客流量急剧攀升,线网规模不断扩大且愈发复杂。以上海为例,截至 2024 年 7 月,其轨道交通网络运营线路达 20 条,车站 508 座,运营里程 831 千米,历史最高客流纪录高达 1339 万乘次。复杂场景下,超大规模轨交线网短时客流呈现出显著的非线性和波动性,受众多内外部因素影响,如天气变化、大型活动举办、工作日与节假日差异等。基于单一深度模型在捕捉复杂时空特征的局限性,本文针对 9 号线徐家汇站真实数据集中对该模型进行测试,并将预测结果与两个单一模型进行对比,在 RMSE、R 、MAE 与 MSE 评估指标中,LSTM-CNN模型均得到最高的预测精度,结果表明该模型具有一定的优越性。
2. 复杂场景下轨交短时客流
2.1 复杂场景分类及影响
在城市轨道交通运营中,复杂场景涵盖多种情况,它们会以不同方式对短时客流产生影响,增加客流的不确定性和管理难度,具体包括节假日、大型活动、突发事件等场景,均会从不同角度、以不同形式对短时客流产生显著影响,或引发客流激增、流向改变,或造成客流积压、疏散混乱,甚至导致客流减少与异常波动。
2.2 短时客流时空特征
短时客流在城市轨道交通中呈现复杂时空特征,对其深入分析能为运营优化提供关键依据,本文以徐家汇站为研究对象进行分析。其作为地铁1、9、 11 号线的重要换乘枢纽,地处城市核心商业区,客流呈现显著的时空特征。时间维度上,工作日 7-9 点、17-19 点形成早晚高峰,早间大量通勤族由此前往工作地,晚间则叠加下班、购物人群;周末休闲出行增多,商业客流大幅攀升,通勤客流相应减少;节假日所在月份因返乡、返程,旅游旺季因周边景点吸引力,客流均达高位。同时,恶劣天气、大型活动、线路故障等突发事件,会引发短时客流剧烈波动,如恶劣天气使地面交通受阻,导致该站客流剧增。空间上,徐家汇站与相邻站点相互影响,作为换乘节点,其客流异常会传导至关联线路,对整个线网产生影响;作为城市核心区域站点,客流量远超城市边缘站点,且兼具通勤、商业、旅游等多重客流特征,早晚高峰以通勤为主,白天和周末则因商业活动吸引大量购物、休闲人群。
3. 基于 CNN-LSTM 模型构建
卷积神经网络(CNN)和长短期记忆网络(LSTM)作为深度学习领域的重要模型,已在诸多领域取得显著成果。CNN[1] 能够自动提取数据的空间特征,在处理图像等具有空间结构的数据时表现出色;LSTM 则擅长处理时间序列数据,有效解决长序列中的梯度消失和梯度爆炸问题,能够很好地捕捉数据的长期依赖关系。鉴于此,本研究将 CNN 和 LSTM 相结合,充分发挥二者优势,旨在为复杂场景下超大规模轨交线网短时客流风险诊断提供更有效的方法。
3.1 CNN-LSTM 模型
CNN-LSTM 模型结合了 CNN 的空间特征提取能力和 LSTM 处理时间序列数据的优势,主要由三部分构成。
CNN 层:包含卷积层和池化层。卷积层通过卷积核在数据上滑动卷积,利用局部连接和权重共享,提取数据的空间特征。池化层则对卷积结果进行下采样,减少数据维度,保留关键特征,降低计算量。
LSTM 层:负责处理 CNN 层输出的空间特征在时间序列上的依赖关系。LSTM 单元通过遗忘门、输入门和输出门,对历史信息进行选择性记忆与更新,有效捕捉长期依赖,分析客流随时间的变化趋势。
输出层:将 LSTM 层输出的特征进行整合,根据客流量预测,通过合适的激活函数将其转换为最终的预测结果。
3.2 数据在模型中的处理流程
1. 数据输入与预处理:徐家汇站多源客流数据经清洗、归一化等预处理后,按特定格式输入模型。
2.CNN 层特征提取:数据进入CNN 层,卷积层提取空间特征,池化层对其降维。多次卷积和池化操作后,得到高级空间特征并传递给 LSTM 层。
3.LSTM层时间序列分析:CNN层输出的空间特征进入LSTM层,LSTM 单元根据当前输入和历史记忆,通过门控机制分析时间序列中的依赖关系,记住客流空间特征的时间变化趋势。
4. 输出层预测:LSTM 层的输出进入输出层,全连接层根据任务需求进行处理,通过激活函数得到预测结果,用于轨交运营管理决策。
3.3 基于 LSTM-CNN 模型的构建步骤
3.3.1.Step1 数据输入:构建三维时间特征
1、多维数据结构化
将徐家汇客流数据组织为三维张量
, 其中:
时间维度 (T) :总时间步数, ,覆盖多日数据;空间 - 特征维度(W) :包含 2 类基础特征 +3 类规则特征 (W=5♯♯)
① 基础特征:进站客流(C1 )、出站客流 (C2) ;
② 规则特征:是否为工作日 (C3) 、是否为双休日 (C4) 、是否为节假日(C ( 均为 0/1 编码 );
通道维度( ) :单一通道
2、时间窗口滑动策略
采用固定窗口长度 预测未来 1 个时间步 (15 分钟 )客流,即输入样本为 Xr1⊔i≠j ,标签为 yi= 进站客流+
3.3.2.Step2 CNN 层:时空特征与规则特征的卷积运算
1、卷积核设计与特征提取
核尺寸 k=3 :沿时间维度滑动,每次处理 3 个连续时间步的 5维特征;输出特征图数量 F=32 :学习 32 种不同的局部模式,如:“工作日早高峰进站激增”“双休日午间出站平稳”等;
三维卷积卷积运算:

K⋅G,r :第 f 个卷积核在第i 个时间步、第c维特征上的权重;
规则特征的作用:若 c=3 ( 工作日编码 ) 对应的权重 Ki,3,I 较大,该核专门响应工作日相关的客流模式。
2、池化层:时间维度下采样
池化核 s=2 :沿时间维度每2 个时间步合并为1 个,保留最大值:Pt,f=max(H2t,f,H2t+1,f) (t=0,1,…,Tt/2)
输出维度变化:输出时间步 T= 12→输出时间步 T′=6 ,特征图维度保持 F=32 ,形成 6×32 的特征矩阵。
规则特征的保留:池化后仍保留规则特征与客流的关联,如双休日标签对应的特征值在池化后依然影响峰值位置。

图 2:进站客流量第一个卷积层特征(Filter1-Filter126)
3.3.3.Step3 扁平化层与 LSTM 层:时序建模的维度变
扁平化层:从二维到一维的特征展开
将池化后的特征矩阵 R6×32 展平为 6×32=192 维向量 xt ,作为 LSTM的输入序列 {x1,x2,…,x6} 。
LSTM 层:规则特征驱动的门控计算
设LSTM 隐藏层维度 H=64 , 则关键公式的矩阵运算细节如下:
遗忘门: 
Wf∈R64×(64+192) :权重矩阵,前 64 列对应历史隐藏状态,后 192 列对应当前输入( 含规则特征);
若输入中“双休日 =1”, xt 对应维度为 1,可能通过Wf 的对应列降低遗忘门对“工作日模式”的权重。
输入门与细胞状态更新:


节假日编码为1时, xt 对应维度可能通过 Wi 增强“异常出战客流”特征的输入权重。
输出门: 
输出状态 h⋅t 融合了规则特征影响下的时序依赖,如“双休日 + 午间客流高峰”的隐藏表示。
3.3.4.Step4 全连接层:多特征融合的预测输出规则特征的独立映射分支
为规则特征设置单独的线性层,与LSTM 输出联合预测:

参数意义:
Wr[ 1]表示双休日对客流的基础影响,如双休日进站客流平均减少 / 增加的固定值;
Wr[ ]表示节假日的特殊调整,如春节期间的异常值。
损失函数与反向传播路径总损失: L = 1 ∑iN=1( yi − ( yˆlstm i + yrule i ))2
梯度传递:
对CNN 层:通过
反向传播,优化卷积核权重 K ;对 LSTM 层:通过yˆlst 反向传播,优化Wf , Wi , Wc ,Wo ;对规则分支:通过yˆru le反向传播,单独优化 Wr , br 。3.3.5.Step5 结果分析
表1:单个车站的评价指标对比

在对上海地铁 9 号线徐家汇站的预测模型评估中,CNN-LSTM模型展现出了卓越的性能。相比 CNN 和 LSTM 单一模型,其 MSE为 80.1229,RMSE 仅为 8.8523,MAE 达到了 6.0732,远低于 CNN和LSTM,表明其预测值与真实值的平均绝对误差极小。最关键的是,CNN-LSTM 组合模型进站客流量 R2 为 0.99913,出站客流量 R2 为0.99936,综合 R2 高达 0.99954,接近完美拟合,说明 CNN-LSTM模型对数据的拟合能力远超另外两种模型,能够更精准地捕捉数据特征,在预测任务中具有显著优势,是三个模型中最为可靠和准确的预测工具。
3.3.6.Step6 模型性能评估
本文通过结合卷积神经网络(CNN)和长短期记忆网络(LSTM)提出了一种针对单个车站的预测模型,并以上海地铁 9 号线徐家汇站客流数据为依据进行训练和测试。通过详细分析其自动售票系统数据,发现该模型在预测准确性和泛化能力上表现优异。CNN 层通过捕捉空间上的复杂特征,有效处理了车站周边空间信息对客流的影响;LSTM 层则深入挖掘时间序列数据中的长期依赖关系,从而提高预测的准确性和精度。在关键性能指标上,CNN-LSTM 模型 [2]展现出较低的 RMSE 和 MAE 值,表明其具有较高的预测准确性,而较高的 R2 值则说明其具备较强的解释能力。相较于单一的 CNN和 LSTM 模型,CNN-LSTM 模型展现出更好的性能和鲁棒性,进一步验证了其在处理复杂非线性数据和利用空间关系与时间序列信息方面的优势,为城市轨道交通短时客流预测提供了更可靠的工具。
3.4 模型训练优化
定比例划分为训练集、验证集和测试集。本文将徐家汇站客流数据集划分为 70% 训练集、 15% 验证集和 15% 测试集。训练集用于模型的参数学习,让 CNN-LSTM 模型从这些数据中学习到徐家汇站短时客流的规律和特征,同时学习不同因素对徐家汇站短时客流的影响模式 [3]。验证集用于调整模型的超参数,在模型训练过程中,通过在验证集上评估模型性能,本文采用 RMSE、R2、MAE 与MSE 四个评估指标,来确定最优的超参数组合,避免模型过拟合或欠拟合。测试集则用于评估模型的泛化能力,在模型训练完成后,使用测试集数据进行测试,观察模型在未见过的数据上的表现,判断模型是否能准确地预测徐家汇站短时客流风险。在训练过程中,CNN 和 LSTM 的参数会同时进行优化。通过反向传播算法,根据预测结果与真实值之间的差异,调整 CNN 和 LSTM 的权重,使模型整体的预测性能不断提升。两者协同工作,CNN 提供的空间特征为LSTM 的时间序列分析提供了更丰富的信息,LSTM 则对这些空间特征在时间维度上进行动态分析,最终实现对超大规模轨交线网短时客流风险的精准诊断。
4. 改进方向
首先,该模型场景泛化性受限,模型仅基于单一换乘站(上海地铁 9 号线徐家汇站)数据验证,未覆盖线网中边缘站、非换乘站等差异化场景,未来可以致力于扩展多类型站点数据,构建分层诊断框架,增强模型在线网级的普适性。其次,动态特征耦合机制待深化,规则特征(如节假日编码)虽通过独立分支映射(Step4),但其与时空特征的交互仍依赖人工设计权重,未实现动态自适应耦合,未来可引入注意力机制 [4],自适应加权规则特征与时空特征的关联强度,提升多因素耦合场景的响应灵敏度。最后,外部因素覆盖不足,数据仅包含基础规则特征(工作日 / 节假日),未纳入天气、突发事件等关键外部变量,未来可改进融合多源异构数据(气象API、事件通告),扩展特征维度,提升极端场景的鲁棒性。
表2:符号说明

结束语:
本文面向超大规模轨交线网在节假日、大型活动及突发事件等复杂场景下呈现的短时客流非线性波动难题,构建 CNN-LSTM 融合模型,充分利用 CNN 空间特征提取与 LSTM 时序依赖捕捉的协同优势,以上海地铁 9 号线徐家汇站真实数据集开展验证,模型 R²达 0.99954,RMSE 仅 8.8523,显著优于单一 CNN 与 LSTM 模型,实现客流风险精准诊断,为运营调度提供可靠决策依据,并指出场景泛化、动态耦合与外部因素拓展等后续研究方向。
参考文献:
[12] 张思楠. 基于LSTM 和GCN 的轨道交通短时客流预测研究[D]. 山东建筑大学 ,2024.
[2] 李淑庆 , 李伟 , 刘耀鸿 , 等 . 基于组合深度学习的轨道交通短时进站客流预测模型 [J]. 重庆交通大学学报 ( 自然科学版 ),2024,43(02):92-99.
[3] 朱广宇 , 孙歆霓 , 杨荣正 , 等 . 变时间尺度城轨客流的本征模量分解及组合深度学习预测[J]. 电子与信息学报 ,2023,45(12):4421-4430.
[4] 张金雷 , 陈奕洁 ,Panchamy Krishnakumari, 等 . 基于注意力机制的城市轨道交通网络级多步短时客流时空综合预测模型[J]. 地球信息科学学报 ,2023,25(04):698-713.
作者简介:黄颖(2005.5—),女,汉族,安徽省六安市人,本科在读,研究方向:交通运输。