缩略图

应急广播系统终端运维管理中常见问题的原因分析及对策研究

作者

王鹏

峨山县融媒体中心 云南省 653200

广播电视行政管理部门按应急广播系统运维质量要求,对各级应急广播系统运维情况进行考查和管理,使之可管可控。这就需要获取和汇总各个应急广播系统的运维数据,对应急广播系统的资源、运行状态、播发状态、播发内容和播发效果,进行数据收集、处理和评价。

一、终端在线率

终端在线率管理,参考指标是终端平均在线率。终端在线率,是应急广播系统所属在线终端数除以终端安装总数。因终端的在线或离线是偶发的,同时终端安装总数也因维护拆除或新增而变化,所以终端在线率是一个随时变化的量。

终端平均在线率,是一个月内应急广播系统的终端在线率的平均值。

二、终端在线率低的原因

1.SIM 卡故障

因 SIM 卡故障,导致终端在线率低。

1)SIM 卡欠费

如峨山县应急广播平台 2024 年 12 月初终端在线率较低,只有 30% ,原因是终端 SIM 卡欠费了,被运营商断网,无法连接到应急广播平台服务器,导致大量终端离线。

2]SIM 卡接触不良

峨山县应急广播平台终端离线维护过程中,许多终端是刚维修完,可是过两天又离线了,后来反复查找原因,是终瑞里的 SIM 卡接触不良。

也有终端离线原因是设备安装于 2021 年,建设时间早,且终端在户外日晒雨淋,受环境影响,设备积灰积水,导致SIM 卡接触不良频繁离线。

2.终端掉电

因终端掉电,导致终端在线率低。

1)人为破坏终端供电

部分终端离线原因主要是每天中午12 点和下午 18 点两次的日常宣传扰民,住宅离终端较近的群众因应急广播声音太大,被人为破坏电缆,导致供电中断,终端离线。

2)终端供电方式单一

许多终端只有市电供电,一旦电网公司发生停电事宜就会导致应急广播终端因供电故障而离线,而峨山县应急广播系统二期工程已经进镇级和部分村级终端配置UPS 电源,保障在发生部分极端情况下仍能保持终端在线。

3.终端硬件老化损坏

因日晒雨淋等恶劣自然因素导致终端老化损坏,终端在线率低。

如部分终端在线率较低,原因是位置处于高海拔山区村落,室外终端设备工作环境恶劣,自2021 年建成安装使用以来,设备已经工作近 4 年之久,出现故障的较多。

4.终端维护跟不上

因终端维护跟不上,导致终端在线率低,

1)维护人员少

峨山县属于山区县,全县 8 个乡镇街道,除县城区域内的双江街道外,其余7 个乡镇均属于山区,道路交通不方便,路程较远,运维公司维护人员车辆少,维修不及时。

2)运维单位交接不及时

运维人员与各乡镇村组应急广播终端负责人缺乏对接沟通方式,导致离线终端不能及时得到处理。

5.平台维护

因系统平台维护,导致终端在线率低。

1)平台升级

峨山县应急广播平台处于试用阶段,平台部分功能存在 bug 和不完善,通常在使用过程中发现一个然后上报给厂家技术人员,厂家技术人员再对平台软件进行升级导致平台没有在线率数据。

2)县级平台与市级平台连接不稳定

如许多次峨山县应急广播平台终端在线率较低,原因是县级平台传至市级平台的在线率数据发生延迟甚至错误,导致市级平台误认为终端在线率较低,而实际情况是在线率均在 90% 以上。

3)平台等保测试

如有次平台终端在线率较低,虽然平台在线,但未同步数据,终端上报数和终端在线数都是 0 检查原因是在做等保测评,系统功能受影响。

4)终端安装数据未及时在平台更新

如有次平台终端在线数略低。原因是,峨山县应急广播二期建设工程新安装的终端设备还未录入系统,但统计终端总数增加,导致在线率突然降低。

如有次平台终端在线率变化大。建设单位的终端数据和系统录入的终端数据不一致,是因为有损毁更换的终端没及时删除。

如有次平台终端在线率略低。原因是,终端 SIM 卡故障时更换新 SIM 卡,更换上的新 SIM 卡重新产生数据,而换下去的旧 SIM 卡没有从系统里清除,导致终端数据重复计算,使安装数增加而降低了在线率。

6.异常天气影响

如有次平台终端上报数正常和终端在线率略低。因是,因前日大风暴雨天气原因,导致终端部分停电,在率有所下降。

如有次平台终端在线率略低,原因是,最近阴雨天多经排查,都是雷电引起离线导致的。

7.网络故障

因专线网络故障,平台离线,无法上报数据,导致终端在线率低。

8.平台参数设置错误

如有次峨山县应急广播平台终端在线率数据为 0 。原因是,回传服务器配置错误,平台接收不到终端回传的状态数据。

三、提高终端在线率的办法

1.提高平台在线时长

只有市级平台和县级平台在线,才能接收终端状态信息,才能汇总数据,才能上报终端数据,所以要保障市县平台工作正常,提高市县平台在线时长。

2.保障终端网络使用费

终端通过网络回传其状态,如仅因 SIM 卡欠费等导致法使用网络回传终端状态,就会被平台视为终端故障高线直接降低终端在线率。

3.终端具备两路供电接口

大多数应急广播终端是市电供电,山区部分终端可加装太阳能供电。可使终端同时具备两路供电接口,可以在和中断时景急加装太阳能供电模块,或平时就是市电和太阳能供电,以保障终端正常工作。部分有条件的地方,可加装 ups电池,进一步保障应急广播终端供电。

4 市县应急广播平台完善终端数据规范化检索功能

终端数据包括地理坐标、行政镇村、标识字符等参数人工录入。终端数据量很大,数据就很容易出错,特别是坐标不准、字符用错、空格等。

完善平台功能,平台应具备终端数据规范化检测,提供界面出错指示,以便修正。这样也便于市县平台业务和运维人员检索终端信息数据,防止因录入原因造成数据失真。

5.改善终端硬件质量

因终端工作在室外,长期使用,日晒雨淋,会导致终端老化,引起故障,使终端掉线。处理办法一是与应急广播终端供应单位联系,提高质量;二是采用购部分备品备件,用于替换损坏终端。

6.完善平台使用规范

1)对全县范围的每个终端进行排查,定期清理已拆除终端的信息,使终端安装数真实。

2)检查备用终端信息的录入情况,清理未安装的备件终端的信息,使终端安装数真实。

7.加强终端维护

1)与乡镇村组的终端负责人员积极配合做好维修维护,继续加强终端巡检。

2)督促维护人员抢抓时间,及时维护故障终端,努力提高在线率。

3)做好终端备品备件储备,保证终端维护需要。

4)做好终端维护技术培训,提高维护效率。

四、优化应急广播系统结构

目前获取各个应急广播系统的平台在线情况和终端在线率,是由各个平台主动上报。存在两个问题:

在线时长基于平台的在线状态。运维实践中,各市、县平台的在线状态基于省平台是否接收到其心跳消息。心跳消息的发出、传输、接收、回执四个环节,都会影响省平台对各市、县平台在线状态的判断,及各市、县平台对自身在线状态的判断。任何一个环节中断,都会导致平台状态判断不准,从而产生错误数据。

在线率由下级平台首先汇总然后上报省市平台。技术上,汇总的数据和上报的数据存在脱离的可能。在二者脱离情况下,此时,无论下级终端和适配器、IP话简等资源数据、资源状态发生怎样的改变,省市平台接收到的数据都是符合技术管理要求的数据,而掩盖了真实发生的情况。

五、结束语

本文旨在探讨应急广播终段管理的重要指标,包括在线时长和在线率。此外,本文还深入探讨了在运维实践中影响这些指标的各种因素以及相应的应对策略。同时,从体系结构的角度出发,本文还对如何获取平台客观准确的指标数据进行了研究,并提出了一种方案以独立评估其运行情况。

作者简介:

王鹏,1989 年,男,助理工程师,毕业于吉林大学,工学学士,玉溪市,主要从事广播电视节目、网络视听节目、应急广播节目制作和播出技术支持保障工作。