缩略图

提高油品调合中心铁路栈桥装车系统稳定性

作者

刘雪芹 李建纲 田得旺

兰州石化机电仪运维中心仪表二部 兰州石化油品调合中心机动设备科

【关键字】:铁路栈桥;装车系统;服务器;死机;整改措施

0 引言

兰州石化油品调合中心160/161/163 铁路栈桥火车槽车装车系统肩负着兰州石化成品油销售的艰巨任务,如果不能正常工作,将造成油品出厂后路不畅,影响前系统的原油加工量,同时也影响客户的成品油供应。装车控制系统于2016 年5 月投用,不仅实现了自动定量铁路装车,还将装车数据传送至铁路销售系统(TMISS 系统)和计量平台(MES 系统),实现了自动开具结算单,以及计量平台的数据统计功能。近期,系统频繁出现数据库服务器、OPC 站、操作站死机重启故障,给正常的成品油贸易交接工作造成了严重影响。

1 系统简介

160/161/163 铁路栈桥火车槽车装车系统下位采用西门子 S7-400 PLC 实现装车控制,上位采用iFix5.8 实现装车监控功能。为了保证装车安全与数据的准确性,将现场流量计RS-485 通讯信号和脉冲信号均接入系统,通讯信号用于计量结算,脉冲信号用于装车控制。在装车过程中,两个数据可以实时进行对比,当出现明显问题后,可以及时停止装车,有效防止故障的进一步扩大。

装车系统监控层由7 台操作站(OP01-OP07)和 1 台工程师站组成,其中工程师站兼数据库服务器功能,为装车系统装车数据服务器,OP04 兼OPC 功能,为TMISS 开票系统数据服务器。

2 典型故障

2024 年11 月 3 日,装车系统中控室操作站首次出现数据中断现象,2025 年3 月6 日至3 月12 日,装车系统频繁出现数据中断现象,再后来,操作站也不定时无故重启。

当系统出现数据中断现象后,工程师站均处于Administrator 登录界面,输入密码登录 Windows 系统后,系统跟刚开机状态一样,iFix 5.8 监控软件并未运行。再查看防火墙服务设置,处于“禁用”状态。重新启用防火墙服务,系统数据即可恢复正常。综上可以初步推断,装车系统数据中断属于工程师站自动重启后,防火墙设置无故被禁用所致。

3 故障原因分析

引起主机重启的可能原因主要有主机供电不稳定、主机硬件运行异常、以及系统中病毒。装车系统出现数据中断故障后,只要手动启用防火墙功能,系统即可实现故障恢复。因此,可以排除电源供电不稳定和主机硬件故障的因素,故障原因只有系统中病毒。

仪表专业对工程师站安装最新版本的火绒杀毒软件,全盘扫描发现病毒,之后再对操作站逐台进行病毒扫描,均发现病毒,病毒名称和工程师站一致,至此,可以确定故障原因系系统中病毒所致。

针对病毒来源的问题,仪表专业对铁路栈桥装车系统网络结构排查发现,1#交换机上连接有MES 系统的Buffer 机,Buffer 机和交换机之间没有安装防火墙。铁路栈桥装车系统和OP04(04#操作站兼OPC 站)通过硬件防火墙隔离后连接,病毒库长期得不到升级,也可能造成系统染毒。

4 系统安全探究

铁路栈桥装车系统原设计只提供自动装车功能,装车系统在一个孤网内运行,没有杀毒软件和防火墙,对病毒的免疫基本为零,安全等级较低。后来因工艺为了提高办公自动化程度,降低劳动强度,增加了自动开具装车单的功能,在装车系统内为铁路办公提供了网络接口。计量平台为了实现一键提取数据,也在装车系统内为计量平台所在的办公网提供了网络接口,但这两个网络接口处没有物理防火墙设备,存在中毒风险。

4.1 外部网络接口安全型分析

装车系统中控室 1#交换机上连接有MES 系统的 Buffer 机,Buffer 机和装车系统之间没有安装网络安全设备进行有效隔离,MES 系统客户机大多为办公网电脑,因此,系统存在中毒风险。铁路系统和OP04(04#操作站兼OPC 站)虽然通过硬件防火墙隔离后连接,但病毒库长期不更新,也可能造成系统染毒。

4.2 网络结构稳定性分析

数据库服务器和工程师站由一台操作站兼任,中间数据库服务器由OP04 兼任,这两台数据库服务器均没有冗余备机,当在用的服务器出现故障,系统将不能正常完成装车任务。

4.3 操作系统稳定性分析

铁路栈桥装车系统操作站操作系统为 Windows 7,微软官方自2020 年 1 月 14 日已正式停止对 Windows 7系统的外延支持,也就是不会再给 Windows7 系统提供安全补丁,安装 Windows 7 的计算机将不受 MicrosoftSecurity Essentials(MSE)的保护,操作系统方面的安全等级将大幅降低。

通过以上分析可以得出,系统在网络外部接口安全,网络节点配置,以及操作系统稳定性方面均存在安全隐患,需要对其进行改造。

5 整改措施

措施1 针对网络外部接口安全隐患,建议在接口处安装防火墙,并制定对防火墙病毒库进行升级的计划。

措施2 针对网络节点配置隐患,建议对数据库服务器和中间库服务器作冗余配置。

措施 3 针对操作站操作系统安全隐患,建议将操作系统升级至Windows 10,并升级配套应用软件,以保证操作系统的安全型以及操作站硬件的供应稳定。

6 结束语

本文对栈桥装车系统中毒事件进行深挖,发现系统存在的三项不安全隐患,针对发现的隐患,提出了切实可行的三项整改建议,希望能够对铁路栈桥装车系统的稳定运行提供些帮助。