基于YOLOv5s的麦穗多尺度检测优化及边缘实时部署方法研究
郑宗凯 陈佳悦 吴宇霖 张俊杰
佛山大学 广东佛山 528200
摘要:本研究针对小麦麦穗与籽粒检测[1]中的多尺度特征提取、密集目标抑制及边缘设备部署效率等问题,提出基于YOLOv5s的优化模型[2],通过数据驱动的锚框动态适配策略与跨阶段局部特征融合模块,提升多尺度目标检测[3]能力,针对密集麦穗簇场景,结合动态阈值调整机制提出方向敏感DIoU-NMS算法,高重叠区域的误检率降至9%。通过FP16量化与CUDA流并行化技术,模型体积压缩至14 MB,推理速度达22.2 FPS,单帧时延降至45 ms,模型在mAP@0.5(0.89)与实时性优于YOLOv8[4],为田间精准监测提供高效解决方案。
关键词:小麦检测、YOLOv5s、多尺度锚框优化、DIoU-NMS
一、引言
1.1研究背景
小麦麦穗与籽粒检测是农业自动化监测的核心任务,然而麦穗长度为10-15 cm,籽粒粒径仅有2-3 mm,传统模型在同时提取大尺度目标和微小目标的特征时存在局限,且田间场景中密集分布的麦穗常受叶片遮挡、土壤背景及杂草干扰,模型误检率较高,现有模型难以满足≥20 FPS的边缘设备实时检测需求。
1.2国内外研究现状
农业目标检测领域的研究存在亟待解决的问题。两阶段检测模型通过多尺度特征融合在通用数据集上精度高,但因参数量大、计算复杂,难以部署于算力有限的边缘设备;单阶段模型实现速度与精度平衡,但默认锚框不适配小麦麦穗和籽粒尺度,影响定位精度。密集种植场景下,NMS算法处理重叠目标能力不足,导致漏检或误检。
二、相关理论与研究技术
2.1研究目标
本研究以YOLOv5s为框架设计小麦麦穗检测优化方案。通过数据驱动重聚类锚框尺寸,生成适配麦穗与籽粒尺度的定制锚框,提升定位精度。在特征融合阶段引入跨阶段局部连接,缓解微小目标特征丢失。针对密集重叠目标设计轻量化DIoU - NMS算法优化抑制策略,降低漏检率。用TensorRT引擎进行FP16量化与层融合部署,结合CUDA流并行技术处理,为农业自动化监测提供方案。
2.2主要研究内容
(1)多尺度目标锚框的动态适配
麦穗与籽粒尺度差异显著,传统锚框基于通用目标设计,难以匹配田间场景的特殊分布。需通过K-means++算法对标注数据聚类,生成适配细长麦穗与微小籽粒的定制化锚框组,优化宽高比及数量分配,解决初始框覆盖不足导致的定位精度下降问题。
(2)跨阶段特征融合中的细节保留
传统模型采样会丢失微小籽粒的细节特征,麦穗漏检率高。研究在YOLOv5s的Neck部分设计跨阶段局部连接模块,跳跃连接深层网络传递特征,利用1×1卷积对齐通道维度,避免特征融合时的维度冲突。
(3)密集重叠目标的鲁棒抑制
田间麦穗簇重叠率超30%,传统NMS算法依赖单一DIoU阈值,易误删方向一致的有效检测框。研究在交并比计算中引入麦穗长轴方向约束,动态调整抑制阈值,解决密集场景漏检与误检矛盾。
(4)边缘设备的高效部署适配
模型在边缘设备上推理效率不足,处理占用大量资源。研究通过TensorRT引擎对模型进行压缩参数量;同时设计异步流水线架构,将解码、NMS与可视化任务分配至独立CUDA流,实现降低单帧延迟。
三、设计的总体方案
3.1多尺度锚框动态适配策略
针对麦穗与籽粒尺度差异,用K-means++算法对标注数据集边界框聚类,生成9组定制化锚框,在 YOLOv5s 特征层分配锚框,浅层用<5×5 cm小锚框捕捉籽粒,深层用> 10×3 cm大锚框检测麦穗。引入宽高比敏感因子,量化长宽比偏差,降低麦穗定位误差。
3.2跨阶段局部特征增强架构
为防微小籽粒漏检,在Neck模块设跨层跳跃连接,将浅层高分辨率特征图注入深层特征金字塔。用1×1卷积核对齐通道维度,逐元素相加融合特征。融合层后加轻量化SE注意力模块,强化关键特征,抑制背景噪声。
3.3密集目标抑制优化算法
针对麦穗簇高重叠误抑制问题,提出改进型方向敏感DIoU-NMS算法,交并比计算融入方向约束项,提升细长目标区分度。建立动态阈值机制,自适应调整抑制阈值。
3.4边缘计算加速部署方案
为在边缘设备实现≥20 FPS实时检测,构建TensorRT部署优化体系。用FP16混合精度量化压缩模型体积,用TensorRT层融合减少GPU开销,用CUDA流并行技术分配任务。
四、模型性能对比与分析
4.1 实验结果数据分析
(1)多尺度目标检测精度提升
PR曲线显示,模型在召回率达0.92时保持0.88的精确率,在置信度阈值0.5时F1值达0.90,有效缓解了麦穗与籽粒的尺度差异问题。对比显示,模型对籽粒漏检率低于5%,结合P曲线,模型在籽粒检测中的AP@0.5提升至0.78,验证了浅层高分辨率特征保留策略的有效性。
(2)改进NMS算法的性能验证
优化后的方向敏感DIoU-NMS将误检率降至9%。R曲线显示,模型在高密度场景中召回率保持0.85,混淆矩阵中误分类比例仅为3.2%,方向约束与动态阈值机制显著降低了密集遮挡导致的误检。
(3)边缘部署效率优势
通过TensorRT量化与CUDA流优化,模型的单帧推理时延为45 ms,满足≥20 FPS的田间需求。对比YOLOv5s速度提升52%,模型体积压缩至14 MB,适配边缘设备存储限制。
4.2对比分析
以Faster R-CNN、YOLOv5s及YOLOv8为对比基准,关键性能指标如下表:
五、总结
本研究针对小麦麦穗与籽粒检测难题,基于YOLOv5s架构提出优化模型。数据驱动锚框适配与方向敏感 DIoU-NMS 算法,mAP@0.5达0.89,较YOLOv8提升4.7%。跨阶段特征融合模块强化籽粒检测能力,AP@0.5提升至0.78,较基线提升25.8%。经TensorRT量化与CUDA流优化,模型体积压缩至14 MB,推理速度22.2 FPS。在高重叠场景误检率较Faster R-CNN降低59%,为小麦生长监测提供高效技术支撑。
参考文献
[1] 耿晶,李海康,崔清亮,等.基于深度学习的农田小麦麦穗检测研究[J].南方农机,2025,56(07):4-7.
[2] 王宇.基于改进yolov5s模型的小麦田间杂草检测研究[D].安徽农业大学,2022.DOI:10.26919/d.cnki.gannu.2022.000064.
[3] 惠康华,杨卫,刘浩翰,等.基于YOLOv5的增强多尺度目标检测方法 [J].兵工学报, 2023, 44 (09): 2600-2610.
[4] 侯依廷,饶元,宋贺,等.复杂大田场景下基于改进YOLOv8的小麦幼苗期叶片数快速检测方法[J].智慧农业(中英文), 2024, 6 (04): 128-137.
作者简介:郑宗凯(2004),性别:男,民族:汉族,籍贯:广东汕尾,单位全称:佛山大学 广东 佛山 南海区 528200,佛山大学本科生,研究方向:视觉检测模型