缩略图
Liberal Arts Research

间面向市域铁路的云设计及核心技术实现

作者

齐立

上海云赛智联信息科技有限公司 上海 200233

摘要:本文以近期参建的上海市域铁路机场线云平台建设项目为背景,详细描述了市域铁路云平台的设计及关键技术,包括云系统架构、云路由、网络、备份、信息安全、计算资源池、存储系统等,同时详细论述了云管平台核心技术的实现,旨在探索上海作为超大型城市建设背景下高效、互联交通系统的市域铁路云的设计与实现。

关键词:市域铁路;市域铁路云;云计算;

0 引言

上海轨道交通市域线机场联络线于2024年12月27日通车,成为了国内首条实现与国铁网络互通互联的市铁示范工程,作为串联城市群时空距离的复合型交通工程,其建设运营涉及土木工程、机电设备、数字系统等数十个专业领域的高度协同。特别是在信息化层面,需构建包含列车信号控制系统、旅客服务信息系统、光纤骨干通信网络、智能供电调度系统等在内的多维数字体系。为解决各系统高可用性、可扩展性、实现跨系统数据互通等问题,基于云服务“资源池化、服务共享、弹性扩展”的核心理念打造系统运行资源池成为了行之有效的方法。

1市域铁路云设计及关键技术

市域铁路云主要针对市域铁路工程中安全生产网业务系统(主要包括客票(客票网安全维护)、建筑设备监控、综合视频监控、电话交换、综合网管以及桌面云等)、内部服务网业务系统(主要包括办公信息、动车组管理、综合维修管理、供电调度运行管理、供电生产信息管理等)、外部服务网业务系统(主要包括客票(消费者客票服务)、安防、视频存储等)提供IaaS服务。

1.1市域铁路云系统架构

市域铁路云平台,建设安全生产网、内部服务网、外部服务网三大核心云资源区,以及云测试中心。通过将桌面云终端区进行桌面接入办公,骨干传输网打通多条市域铁路线路,由云平台对三张网的云资源进行统一管理、运营、运维,最终在云管平台之上建设综合运管平台,对市域铁路的云端数据网络安全各类资源进行统一管理、运营、运维。市域铁路云网架构见图:

1.2市域铁路云高可靠性

云计算平台通过多层次冗余架构与智能化容灾机制构建全栈高可靠体系。在计算层,采用服务器集群虚拟化技术形成弹性资源池,依托HA模块实现物理机故障时虚拟机秒级热迁移,结合Kubernetes容器编排系统保障服务自愈能力,支持7×24小时不间断运行;动态资源调度算法实时监控负载并优化资源分配,使资源利用率提升30%以上;存储层基于双活存储架构与Ceph分布式系统实现数据多副本同步;网络层通过设备虚拟化与多路径冗余技术消除单链路故障风险,控制平面冗余备份使三层转发中断时间趋近于零;数据保护层面集成磁盘/内存快照技术与增量备份机制,提供分钟级数据恢复能力;应用层部署进程级监控代理,通过三级故障诊断实现业务自恢复闭环;管理层采用计算/存储分离架构与管理节点双活部署,结合实时资源审计与一致性校验,构建覆盖硬件、服务、数据的立体化监控网络。

1.3市域铁路云路由

市域铁路云路由设计核心包括云平台中心域中心-接入区-车站两个网络空间的路由设计,其中:云计算平台的数据中心SDN网络采用了Spine-Leaf架构设计。在此架构中,Spine与Leaf设备之间运用OSPF协议搭建基础传输网络,同时通过BGP-EVPN协议构建覆盖网络,各Leaf节点之间以及与Spine节点间创建vxlan隧道,以此满足数据中心的大二层互联需求。不同资源池则经由Leaf节点接入数据中心内部网络,从而实现了数据中心内的通信需求,并支持与外部站点的互访功能。此外,在云计算平台的接入区域,设备与各车站的核心设施之间部署OSPF协议,通过传输网络建立邻接关系并分发路由信息。同时,云计算平台的核心设施与各个接入区域运行OSPF协议,确保了数据中心及接入区之间的路由数据能够有效传递。

1.4网络

利用SDN技术,可以实现计算、存储及网络资源的大规模池化,增强IT基础设施的扩展性和可靠性。此外,以将包含转发与控制平面在内的网络分层解耦,达到数据中心网络架构分布、灵活和高可用性。在分区内部署Underlay网络时,采用Spine-Leaf结构,该方案便于横向扩展,提升了分区的接入能力。Leaf节点与Spine节点间形成全连接,并通过等价多路径增加网络可用性。Overlay控制平面则使用BGP EVPN协议创建VXLAN隧道并交换路由信息,采用SeerEngine控制器对物理网络进行集中管理,确保Overlay业务能够动态部署。

1.5备份

采用备份一体机的方式,以API方式接入云平台,实现云服务器、云硬盘、数据库、文件数据的备份保护。支持整机备份、跨AZ备份恢复,提供租户自助服务的备份/恢复管理操作、全量备份,增量备份,差异备份模式等。

1.6信息安全

信息安全架构上从纵向(即南北向)、横向(即东西向)以及带外管理这三个维度出发,结合边界安全、计算环境的安全性、运维过程的安全保障及应用程序的安全防护等多个角度,为云平台提供全面且多层次的安全防御策略。通过虚拟化技术将安全设备资源池化并建设南北向安全资源池及东西向安全资源池,南北向安全资源池主要聚焦于各子区域间的通信网络安全及区域边界的安全防护,主要通过专业安全设备实现数据传输的安全保障,以及池化的软件资源实现,以实现南北向安全可弹性扩展和按需分配。东西向安全资源池主要针对各子区域内部从虚拟化资源、虚拟化服务角度对云计算虚拟化进行安全防护和策略设计,通过虚拟化平台自身的安全机制及VM层安全防护组件(虚拟机隔离、Hypervisor层访问控制、VM系统安全加固等)实现。

1.7 计算资源池

市域铁路云提供的计算资源主要涵盖以下类型:x86架构的物理主机、ARM架构的物理主机,以及基于这两种架构的虚拟机实例(包括x86虚拟机和ARM虚拟机)。用户能够通过服务目录直接申请所需的物理服务器,云平台将根据用户的请求,自动分配已预先配置好的物理主机。针对虚拟化资源,支持用户根据自身的业务场景灵活申请虚拟机,可自定义选择CPU核数、内存容量、存储空间以及网络接口的规格,并指定所需的操作系统版本。

1.8 存储系统

按数据类型的不同,市域铁路云同时提供集中式存储与分布式存储两种能力。集中式存储采用双活机制,将两台存储同时挂载给集群,通过ALUN多路径协议,正常运行时,集群内的主机可以对两台存储进行读取操作,只对主存储进行写入操作,写入到主存储的数据通过同步传输的方式写入到备存储上;当主存储发生故障时,会自动切换到对备存储进行读写模式,保证业务的正常运行;分布式存储系统基于软件定义的存储技术,通过在计算节点上部署软件抽象层并与底层硬件进行解耦处理,实现了存储服务及服务质量策略的自动管控,这样的架构可以为用户提供灵活的按需使用存储资源的能力。

1.9 统一运维中心

云计算运维管理中心采用了主流的J2EE开发框架,以业务管理与流程模型为核心设计理念,并融入了服务导向架构的先进理念。系统在保证技术领先性与可扩展性的前提下,基于子系统划分,结合分层架构与模块化设计方法,构建了一个高度开放且组件化的基础框架,以适应市域铁路实际运维场景需求,并通过中间件的消息传输机制实现资源监控、CMDB(配置管理数据库)和运维流程管理的整合与集中化管控。此外,平台支持分布式架构及分层部署方式,并提供标准化的RESTful Web服务接口,便于系统的持续集成与扩展性管理。

2市域铁路云管平台核心功能

云管理平台为整个云计算平台的核心管理组件,通过标准的南向API接口对接各个虚拟化管理模块,如计算虚拟化,存储虚拟化,网络虚拟化,安全虚拟化等,进而通过软件驱动的方式部署在相对应的物理硬件设备上,实现对整个硬件设备的资源池化、资源抽象化,并通过消息队列等方式,拉取设备及各虚拟化模块的相关信息,为平台的运营管理和运维管理提供充分的数据支撑。

(1)云服务门户:云计算服务中心整合各类业务系统资源,为用户提供统一的云服务管理界面。通过界面集成、功能整合及数据交互,构建统一的信息服务访问入口。

(2)运维控制台:面向云平台运维人员,以数据为核心,通过运维数据中台,提供精准、快速运维数据处理能力;支持通过LDAP进行多组户管理、鉴权;基于专业运维基座,提供计算、存储、网络、数据库等产品的性能分析、容量预测、异常告警,帮助运维人员全面了解物理资源、虚拟资源健康情况。

(3)自动化作业平台:批量实现裸金属资源实例操作系统初始化、监控初始化、资源纳管,全面提升云资源业务管理能级,支持Python/Shell/Saltstack Function等多脚本,自动跟踪操作进程。

(4)容量平台:定向采集计算资源、存储资源、网络资源分类查询各节点上的物理数量、实例数量、使用率等信息情况。进一步围绕云管业务提供实时查询、趋势分析、容量告警、容量规划等能力。

(5)运营控制台:面向市域铁路云运营工作,通过灵活完善的API来管理包括计算、存储、网络、安全在内的数据中心各种资源。提供用户中心、产品中心、费用中心三大模块。

(6)工单管理:通过自定义工单模块,实现日常业务的流转办理,对工单类型进行分类,提供平台使用人员对平台使用过程发起手动流程的入口,支持关键字查询检索与分权分级工单创建等能力。

(7)服务目录:提供云主机、裸金属、镜像、云硬盘、VDC、VPC网络、弹性IP、防火墙、安全组、NAT网关、安全云等丰富的云服务,通过流程化服务模板和操作向导帮助市域铁路综合业务生产云平台快捷开通云业务用于承载市域铁路生产业务所需的计算、存储、网络等。

3结语

本文探讨了基于云计算技术的市域铁路云平台设计与实现,旨在提升市域铁路系统的高可用性、可扩展性和数据互通能力。市域铁路云平台通过统一构建计算、存储、网络资源池,简化数据处理流程,实现了资源的有效利用和集中化运维管理,在进一步推动市域铁路“四网融合”机制促进跨区域协同建设过程中,市域铁路云平台为市域系统的智能联动和大数据分析应用奠定了良好平台支撑,将在进一步提升城市交通的运营效能和服务水平的过程中扮演重要作用,也为后期市域铁路的建设起到积极的示范作用。

参考文献

[1]张友兵,陈志强,王硕,等.支持四网融合的市域铁路列控系统关键问题研究[J].铁路通信信号工程技术,2025,22(01):105-113.

[2]柴冠华,周宇冠,张波.市域(郊)铁路工程建设标准体系研究[J].铁道技术标准(中英文),2024,6(12):7-13.

[3]唐凯林,姜庆阳,段宏伟,等.智慧城轨列控系统关键技术研究[J/OL].铁道通信信号,2025,61(02):21-27.

[4]何波.铁路5G-R承载技术与组网分析[J].通讯世界,2024,31(01):37-39.

[5]黄建平.上海市域铁路供电调度系统设计[J].铁道建筑技术,2022,(12):74-78.

[6]韦勤.铁路旅客服务信息系统的应用及发展[J].中国新通信,2018,20(11):95.