基于改进YOLOv5的山火检测方法研究

摘要：针对传统山火监测方法成本高、精度低且易受干扰的问题，设计了一种基于深度学习算法的输电线路山火监测装置。通过在Jetson Nano边缘计算盒上搭载 YOLOv5 算法，提升在复杂环境中山火识别的精度。并使用Jetson Nano自带的无线网卡会将识别后的图像数据传输至后端，进行实时监测和预警。有效降低监测成本，提高火灾监测准确性和实时性。实验表明，改进后的方法在山火数据集上的精度达到93.8%，并且在不同场景和光照条件下都表现出良好的鲁棒性，为输电线路的安全运行提供强有力的保障。

关键词：山火监测；图像识别；YOLOv5；深度学习

1 引言

随着我国经济的快速发展，电网覆盖范围持续扩大，输电线路逐渐延伸至森林、山地等偏远地区。这些地区地形复杂、植被茂密，一旦发生山火，极易引发输电线路短路，导致区域性停电，甚至可能引发更大范围的电力系统故障，对人民生活和工业生产造成严重影响。此外，山火还可能对生态环境和人民生命财产安全构成重大威胁。而传统的山火监测主要依赖人工巡视，其效率低、成本高，且难以覆盖大面积区域。

在应对人工巡视成本高等问题上，基于深度学习的山火监测算法在近年来被广泛应用。文献[1]将YOLO算法和NVIDIA的边缘设备 Jetson Nano相结合，对电动车违规载人现象进行查处，为复杂交通环境下的各类情况提供了实时检测方案。文献[2]提出将树莓派、YOLO 识别算法以及阿里云和小程序融合成了一个系统，用于实现基于深度学习的智能火灾检测系统。文献[3]在通过知识蒸馏等模型压缩方法以进一步提高检测实时性，但精度有所下降。文献[4]提出了一种基于YOLOX的输电线路异物检测算法，但由于从网上获取的初始数据集数量不足，而且品质不佳，导致最终的数据集质量也并非很高。

针对以上问题，本文提出了一种基于改进YOLOv5的山火图像识别方法，旨在解决传统山火识别算法准确度低、实时性差以及深度学习数据集少、训练耗时大的问题。研究首先建立了火灾图像数据集。通过数据增强方法预处理数据，防止过拟合，并将山火数据集标注为YOLO格式。然后提出了一种基于YOLO的山火识别方法，通过结构调整提升功能融合能力。实验结果表明，该方法能够快速且精准地识别山火并进行位置标记。最后，YOLOv5模型是在NVIDIA Jetson Nano平台上实现部署的，能够实现实时火灾识别，适用于实际场景应用。

2 算法理论

2.1 基本算法

目标检测是计算机视觉应用过程中的一个重要环节，不仅需要对检测的目标进行分类，还需要精确定位到目标坐标，YOLOv5是目标检测领域的高效算法之一。相较于YOLOv3，YOLOv5在模型训练和推理速度上有了进一步优化，还保持了较高的检测精度。YOLOv5采用了比YOLOv3更加轻量化的网络结构，并加入了自适应锚框计算和数据增强技术，提高了模型在各种场景下的泛化能力。YOLOv5 的整体结构包括主干网络、颈部网络和头部网络，能够有效提取多尺度特征并实现精准的目标检测。YOLOv5网络结构如图1所示。

2.2 改进算法

本文改进后的网络结构如图2所示，与原 YOLOv5算法相比将 SPPF替换为新的多尺度融合模块SPPCSPS，提高了主干网络融合多层次、不同尺度的全局特征信息，解决了烟雾火灾演化过程中烟雾和火焰目标尺度多样，导致检测效果较差的问题。此外，本文在原算法中替换了新的PCANet颈部网络（路径位置聚合网络），让位置信息嵌入到更多的特征图通道中，增强网络对烟雾火灾目标的关注度，有效降低输电线路周边复杂背景的干扰，降低算法的误检概率。

2.2.1 SPPCSPS多尺度融合模块

该结构提取多尺度特征，运用的是层级式设计中，不同大小池化核具有不同感受野的性质。通过与CSP分支结构集合，融合上层特征图的通道特征和多尺度特征，从而增强主干网络的多层次和多尺度特征提取能力，使得提高山火目标检测的精度。

2.2.2 PCANet位置信息融合网络

在输电线路的摄像头视野中，拍摄样本可能包含日落、云朵、雾气等与山火图像特征相似的物体。主干网络在提取特征时，可能对某些通道的位置信息关注不够，导致难以区分在检测过程中所遇到的相似物体，从而产生误检。此外，随着网络层数的增加，特征图的分辨率逐渐降低，提取的位置信息也随之减少。为解决这些问题，本文将CA（位置注意力机制）与原有的顶部网络相结合，提出新的顶部网络PCANet。PCANet不仅将主干网络和顶部网络中的特征图进行拼接融合，还利用位置注意力机制提取方向和位置上的敏感信息，并将其整合到通道中。这种方法有效利用了深层的语义信息和浅层的位置信息，减少了复杂背景下与山火图像特征相似的物体对检测结果的干扰，从而降低误检率。

3 实验

3.1 数据集制作

3.1.1 标记软件配置

为了训练出深度学习的模型，首先需要对图像数据进行标注。本研究使用基于Python环境的LabelImg工具对图像进行标注。LabelImg是一个可视化工具，支持Windows系统，能够生成符合PASCAL VOC格式的标注文件，适用于YOLO等目标检测算法。在配置LabelImg时，需安装PyQt5、lxml等第三方库，安装完成后，可通过命令行启动软件进行标注工作。

3.1.2 数据集的处理

深度学习模型训练的关键步骤是建立数据集。本研究通过网络爬虫脚本获取山火相关图片，并从中筛选出适合训练的图片。为了增加数据集的多样性，对400张原始图片进行翻转、平移、旋转等操作，将数据集扩充至1000余张有效图像。扩充后的数据集统一为jpg格式，并使用LabelImg进行标注，标注信息以.xml文件格式保存。标注过程中，火焰区域被标记为“fire”，并生成相应的标注文件。最终，数据集被分为图像文件和标注文件，分别存放在Images和Annotations-my文件夹中，并按顺序编号以便管理。

3.2 实验环境

基于NVIDIA Jetson Nano平台，GPU由NVIDIA Maxwell架构，具有128个CUDA核心和配备0.5 TFLOPS的计算性能。CPU使用四核ARM Cortex-A57 MPCore处理器，确保高效能的多任务处理能力。系统使用的显存是4GB 64位的LPDDR4显存，其运行频率为1600MHz，宽达25.6GB/s，实现了数据快速存取。此外，16GB sMMC 5.1闪存为存储提供充足的本地存储空间。摄像头的接口支持12通道，传输速率高达18Gbps，适用于处理高分辨率图像。整体大小为69.6mm x 45mm，功耗为5W-10W，AI性能高达472 GFLOPs，适合进行深度学习应用和做边缘计算。

3.3 测试结果

本研究使用YOLOv5模型进行山火识别目标检测。经过300次训练，模型成功识别出火焰目标，并在测试集上的mAP达到85%，实验结果如表2所示，本文算法较YOLOv5的mAP提升1.6%。通过采集实际场景中的图像数据并进行预处理、训练和优化，模型在不同场景和光照条件下均表现出良好的鲁棒性。为直观验证本文模型对山火识别的有效性，进行可视化处理，可视化效果图如图3所示。

4 结论与展望

本文通过使用改进YOLOv5算法对山火进行识别，改进模型通过将YOLOv5中的SPPF替换为SPPCSPS，并将颈部网络替换为PCANet使图像识别具备更快的响应速度和更强的抗干扰能力，降低误检率。研究表明，其性能优于传统山火监测方式，在不同环境下都能产生良好的鲁棒性和实时性。改进版YOLOv5算法的高精度和高效率为输电线路山火监控提供了一种可靠的检测方案，能够有效提高巡检效率和火焰识别速度。未来可进一步突破复杂场景下的山火监测，为山火监测系统提供技术支撑。

参考文献：

1.孙福临，李振轩，粱允泉，等.基于改进YOLOv5算法和边缘设备的电动车违规载人检测[J].现代计算机，2023，29（08）：1-11.

2.金润泽，陈凯，陆晨菲，等.基于深度学习的智能火灾检测报警系统[J].长江信息通信，2022，35（10）：88-91.

3.魏瑞国.基于迁移学习的火灾图像识别方法研究[D].西安工业大学，2022.DOI：10.27391/d.cnki.gxagu.2022.000048.

4.刘健.基于YOLOX的输电线路异物检测算法研究及软件设计[D].中国矿业大学，2022.DOI：10.27623/d.cnki.gzkyu.2022.001285.

项目：大学生创新创业训练计划项目：S202311437077X