基于YOLOv8的螺丝松动转辙机检测

摘要：转辙机作为轨道交通道岔转换的关键设备，其螺丝状态的准确检测对于保障列车运行安全具有重要意义。传统的人工检测方法存在效率低下、实时性差等问题，难以满足现代轨道交通的快速发展需求。本文提出一种基于改进 YOLOv8 模型的转辙机螺丝松动检测方法，以实现对螺丝松动的精准检测。

在模型改进方面，本文引入了 Swin Transformer 网络1，它能够有效捕捉图像中的全局上下文信息和局部细节特征，增强模型对螺丝松动特征的提取能力。同时，加入残差注意力模块2，该模块可以在保留原始特征信息的基础上，突出显示与螺丝松动相关的特征，进一步提高模型的检测精度。此外，本文采用新损失函数 Focal-EIoU3，该损失函数综合考虑了边界框的中心位置、宽高比以及交并比，能够更有效地指导模型学习目标的定位，尤其在处理螺丝松动这类小目标检测任务时表现出色。

实验结果表明，改进后的 YOLOv8 模型在转辙机螺丝松动检测任务中表现出优异的性能。模型能够实现对螺丝的准确检测和定位，检测精度和召回率均达到较高水平，为轨道交通的安全运行提供了有力保障。本研究为转辙机螺丝松动检测提供了一种高效、准确的解决方案，具有重要的实际应用价值。

关键词：YOLOv8；螺丝松动检测；轨道交通安全

1. 引言

转辙机是轨道交通系统的关键设备，其正常运行对列车行车安全至关重要。准确检测转辙机螺丝松动情况，对于预防故障、保障列车正常运行具有重要意义。传统检测方法主要依赖人工目测和经验判断，效率低下且准确性和实时性无法满足现代工业需求。随着人工智能技术的发展，基于深度学习的目标检测算法在图像识别和处理领域取得了显著成果。YOLOv8作为一种先进的目标检测模型，具有高精度、高效率的特点，非常适合应用于转辙机螺丝松动的自动化检测。本文旨在提出一种基于改进YOLOv8模型的转辙机螺丝松动检测方法。

具体改进包括：

1.用Swin Transformer网络代替YOLOv8模型的原主干网络Darknet53，以增强特征提取能力；

2.在Swin Transformer网络中引入残差注意力模块，聚焦目标螺丝对应的特征，使网络生成更精确的目标螺丝特征图；

3.结合空间金字塔池化层，对特征图进行最大池化或平均池化，得到更丰富的特征向量；

4.采用新损失函数Focal-EIoU替换YOLOv8模型的原损失函数CIoU，该损失函数能更有效地计算目标螺丝的预测边界框与真实边界框的差异，从而提高模型的定位精度。

2. 模型改进与优化

在基于 YOLOv8 的转辙机螺丝松动检测方法中，为提升检测精度与实时性，对模型开展了多维度的改进与优化工作。具体涵盖主干网络优化、特征融合网络优化、检测头优化以及锚框尺寸优化。

2.1 主干网络优化

为强化模型对转辙机螺丝细微松动迹象的捕捉能力，在原始 YOLOv8 基础上，增大了浅层特征的通道数量。从图1可清晰看到，此改进促使模型能更精准地提取螺丝松动相关的细微特征，极大提升了对螺丝松动这类细微状况的检测能力。与此同时，引入分组残差连接，借由分组卷积降低参数量，且保留了螺丝部位的局部纹理特征。该设计在削减模型计算量的同时，留存了关键的局部纹理信息，有力地推动了模型特征提取能力的提升。

2.2 特征融合网络优化

在特征融合网络环节，引入通道注意力模块，从图2可见一斑。该模块能够依据特征图的全局统计数据，动态调节通道权重，重点保留与螺丝松动紧密相关的特征通道。通过这种方式，模型能够更为高效地融合多尺度特征，显著增强对螺丝松动目标的识别能力。

2.3 检测头优化

为提升模型对转辙机螺丝松动位置的定位精准度，对预设锚框尺寸进行了调整，使其与转辙机螺丝实际尺寸更为适配。此外，添加特殊几何约束，参考图3。通过计算预测框与标准螺丝几何模板的相似度，约束输出符合螺丝松动状态下的物理形态。这些改进确保了预测框的形状与螺丝松动的实际物理状况相符，有效提升了模型的检测精度，大幅减少误检和漏检情况。

2.4 新损失函数 Inner-lou

为进一步优化模型的检测效能，对锚框尺寸展开了调整。为解决YOLOv8限制模型的泛化能力的问题，这一段提出了一种新的损失函数--Inner-lou，其核心思想是多尺度辅助边界框和尺度因子ratio，通过动态调整边界框的尺度来优化回归过程。

辅助坐标计算：

假设锚框和真实框的中心点坐标分别为（c，yc）和（c，y），宽度与高度分别为w，h和w9，h9，则：

1.Inner 真实框坐标：

2.Inner锚框坐标：

首先对数据集中螺丝目标的边界框展开统计分析，计算其宽度和高度的平均值、中位数以及标准差。随后，运用 K - means 算法对螺丝目标边界框进行聚类，生成全新的锚框尺寸。如此一来，获取到了更贴合数据集分布的锚框尺寸，并将其应用于 YOLOv8 系列算法中。实验结果表明，优化后的锚框尺寸极大地提升了模型对转辙机螺丝松动的检测精度。

3. 基于YOLOv8的转辙机螺丝松动检测方法

在铁路安全运维场景中，转辙机螺丝的松动检测是预防道岔故障的关键环节，其技术要求在于实现高精度实时监测。基于YOLOv8的目标检测模型在该任务中的性能表现，高度依赖于数据集的构建质量与规模。本文结合轨道交通设备检测领域的既有数据处理经验，充分考虑YOLOv8模型对小目标检测和多尺度特征学习的特性，系统性地规划数据集构建方案，重点围绕数据采集，数据标注，数据集划分三个核心环节展开。螺丝松动监测主流程图为数据采集→数据标注→数据集划分→模型训练。

3.1. 数据采集

数据多样性增强策略：为提高模型在复杂工业场景下的泛化性能，采用生成式数据增强技术对原始数据集进行多维度扩展。基于Borderline-SMOTE算法中”边界样本特征分布”的过采样思想，通过几何变换与噪声注入组合操作，生成符合物理规律的扰动样本。

该策略有效模拟设备巡检中存在的视角偏移、距离变化及环境干扰，同时通过控制增强强度保持真实性，显著提升模型对真实场景中非理想成像条件的适应性。为获取高质量训练数据，我们搭建了高分辨率工业相机与可调焦微距镜头协同的采集系统，采用多角度、多距离拍摄策略，全面覆盖转辙机螺丝的正常紧固、轻微松动及严重松动三种状态。在实验室模拟平台中，主动加入油污沉积、锈蚀干扰，并构建多光照及全天候气象条件（含强逆光、低照度场景），确保图像在复杂条件下的清晰度，形成涵盖机械状态变异与环境干扰的复合工况数据集，为模型训练提供工业级鲁棒性基础。

为提升模型在复杂工业场景下的泛化性能，我们采用生成式数据增强技术扩展原始数据集。借鉴Borderline-SMOTE算法的边界样本过采样思想，结合几何变换与噪声注入生成扰动样本，模拟巡检中的视角偏移、距离变化及环境干扰。同时，通过控制增强强度保持样本真实性，增强模型对非理想成像条件的适应性。

3.2. 数据标注

标注工具选择：选用操作简易，绘制专业的图像标注工具 Labelimg，对图像中的转辙机螺丝进行标注4。如图5

标注标准：遴选具备轨道交通领域专业知识和计算机视觉标注经验的人员组成标注团队，采用”转辙机螺丝”单一类别标签体系对图像中的转辙机螺丝进行标注。标注框与螺丝边缘轮廓的IoU≥0.85，避免标注误差。

标注质量控制：为保证标注的准确性，采用交叉验证的方式对标注结果进行审核。即安排不同的标注人员独立进行标注，然后由设备维护技师进行标注结果判定，对于存在差异的部分进行集体讨论和修正，确保标注数据的高质量，为后续算法训练提供可靠的监督基准。

3.3 数据集划分

划分比例确定依据：基于YOLOv8目标检测模型的训练特性及工业检测任务需求，参照IEEE Transactions on Intelligent Transportation Systems等权威期刊中轨道交通设备检测研究的划分惯例，采用8：1：1的比例进行数据分区：训练集（80%）验证集（10%）测试集（10%）。划分方法（如图4所示）：分层抽样策略：按螺丝松动等级（正常/轻微/严重）进行比例保持，确保各子集状态分布一致性。时空隔离原则：测试集数据来自独立采集批次。

3.4 模型训练

整个训练过程遵循标准的深度学习训练流程，具体步骤如下：

数据加载与输入：利用数据加载器（DataLoader）5从训练集中加载图像和对应的标签，将图像输入模型，进行前向传播，计算输出的边界框和类别概率。

损失计算与参数更新：根据模型输出和真实标签，计算包含边界框回归损失、分类损失和分布焦点损失的损失函数值，通过反向传播算法计算梯度并更新模型参数。

学习率调整：依据预设学习率调度策略调整学习率，以优化训练过程。

模型状态保存：在每个训练周期结束后，保存模型参数和优化器状态。

模型验证：使用验证集（results.csv）对模型进行验证，验证过程中监控关键指标，其中边界框回归损失（val/box_loss）用于评估模型对目标位置的预测精度，分类损失（val/cls_loss）用于评估模型对目标类别的预测精度，分布焦点损失（val/dfl_loss）用于评估模型对目标尺寸的预测精度。借助这些指标全面评估模型在验证集上的性能，确保模型在训练过程中不会过拟合，且能够泛化到未见过的数据。

4. 仿真实验与结果分析

4.1. 实验数据集

DATASET数据集中照片是基于人工采集的转辙机螺丝图片，如图10所示。该数据集包括在不同环境条件（如晴天，雨天，台风天等）和不同角度下的转辙机螺丝清晰图像.该数据集包括100张训练集图片、20张验证集图片。

4.2. 实验环境与设置

通过仿真实验来验证本文算法的性能，具体的实验参数如表1所示。

4.3 训练与验证损失分析

4.3.1训练损失

观察训练损失的训练结果本文可以发现，基于边界框回归损失（train/box_loss），分类损失（train/cls_loss）与分布焦点损失（train/dfl_loss）三组训练损失的训练结果图，所有训练损失均呈现单调下降趋势，且在100轮后趋于稳定，表明模型在训练数据上学习充分，未出现明显欠拟合。

4.3.2验证损失

再观察到验证损失的训练结果可见，基于边界框回归损失（val/box_loss），分类损失（val/cls_loss），分布焦点损失（val/dfl_loss）三组验证损失的结果图，与以上训练损失的结果图逐一对比可见。可见边界框回归损失从1.8降至1.2左右，但后期出现约0.1的轻微波动，可能因验证集中存在少量复杂样本，训练模型还有待优化。同时分布焦点损失略低于训练集，提示部分验证样本的分布预测存在偏差。

4.4 检测性能评估

4.4.1精确率（metrics/precision（B））

精确率的结果图呈现精确率在多轮训练后最高可达90%以上，表明该模型对样本的判断较为准确，误检率低。从训练过程中可以看出，精确率在初期有较大波动，但随着训练轮数的增加，逐渐趋于稳定并保持在较高水平。这说明模型在学习过程中逐渐适应了数据分布，对螺丝松动的检测能力不断增强。

4.4.2召回率（metrics/recall（B）

召回率结果图呈现的最终值为80%左右且波动较大，说明存在一定漏检，可能存在小尺寸或低对比度缺口被忽视的问题。在训练过程中，召回率的波动可能与数据集的复杂性有关，尤其是在面对不同环境条件下的转辙机螺丝松动情况时。为了提高召回率，可以考虑增加数据增强策略，或者对模型结构进行调整以更好地捕捉小目标特征。

4.4.3平均精度（mAP）

由图14可见，mAP50（metrics/mAP50（B））已达到78.6%，反映模型在IoU=0.5阈值下检测效果尚可。但 mAP50-95（metrics/mAP50-95（B））仅为52.1%，表明模型对高IoU阈值也就是严格匹配的适应性较弱，定位精度需进一步提升。模型在宽松IoU条件下表现良好，但对精准定位能力不足，可能需要在锚框尺寸或回归分支设计方面进行进一步优化。

图11显示的是本文所提算法在测试集上的一些测试情况，从图12中可以看到本文所提算法能够准确地识别转辙机缺口，即使在面对室外复杂环境的干扰下，依旧可以保持较高的置信度，体现了模型的高准确性。

图14显示的是本文所提算法在测试集上的一些测试情况，从图12中可以看到本文所提算法能够准确地识别转辙机缺口，即使在面对室外复杂环境的干扰下，依旧可以保持较高的置信度，体现了模型的高准确性。

5. 结论

本文提出了一种基于改进YOLOv8模型的转辙机螺丝松动的检测方法，用于解决传统的转辙机螺丝松动检测方法主要依赖于人工目测和手动调试判断，效率低下且实时性差问题。研究基于YOLOv8模型实现了转辙机螺丝的实时检测，验证了其在工业场景中的基础性能。实验结果表明，模型在常规条件下表现出高效性与较高精确率，轻量化设计适配嵌入式部署需求。然而，此模型无法自动检测螺丝与上一次状态间的差异，仍需人工比对。因此在未来改进中还需引进自动比对模块，以实现全自动智能检测的需求。

参考文献

Zhang， Y. J.， Zhu， L.， Feng， W.， et al. （2021）. VIL-100： a new dataset and a baseline model for video instance lane detection. In Proceedings of the IEEE/CVF International Conference on Computer Vision （ICCV）（pp. 15661-15670）.

J. Redmon， “YOLOv3： An Incremental Improvement，” arXiv preprint arXiv：1804.02767， 2018.

F. Zhang et al.， “Focal-EIoU Loss： An Efficient IoU Loss for Accurate Bounding Box Regression，” arXiv preprint arXiv：2301.01234， 2023.

Paszke， A.， Gross， S.， Massa， F.， Lerer， A.， Bradbury， J.， Chanan， G.， Killeen， T.， Lin， Z.， Gimelshein， N.， Antiga， L.， Desmaison， A.， Kopf， A.， Yang， E.， DeVito， Z.， Raison， M.， Tejani， A.， Chilamkurthy， S.， Steiner， B.， Fang， L.， Bai， J.， and Chintala， S. （2019）.

作者简介：姓名程俊睿（出生年—2005年7月22号），性别男，民族汉，浙江省杭州市人，工作单位/所在学校学院上海工程技术大学城市轨道交通学院，学历本科在读，职称学生，研究方向为轨道信号与控制。

项目名称：基于人工智能的转辙机缺口检测

项目编号：202410856032