基于多尺度特征融合与深度监督机制的边缘检测算法
白玉琢
长春电子科技学院 130114
1 引言
边缘检测是计算机视觉的重要基础。传统方法如Sobel、Canny 在简单场景中高效,但在光照变化和复杂纹理下易产生断裂与伪边缘,难以兼顾鲁棒性与精确性。进入 21世纪,多尺度与概率模型方法提升了边缘定位与连续性,但计算复杂、泛化能力有限。深度学习推动了边缘检测的范式转变。2020 年以来,研究重点转向轻量化与实时性,如 PiDiNet[1]、UHNet[2]等网络在保持精度的同时显著降低了计算开销,而基于Transformer 的EDTER[3]则凭借长程依赖建模在复杂场景中表现出色。本文针对传统算法在复杂场景下边缘定位模糊及多尺度特征利用不足的问题,提出基于多尺度特征融合与深度监督机制的边缘检测算法。
2 边缘检测算法的设计
基于多尺度特征融合与深度监督机制的边缘检测算法采用全卷积网络,结合多尺度特征融合与深度监督,兼顾局部细节与全局语义,并通过改进损失函数缓解样本不平衡以提升精度。如图 1 所示,输入图像经 VGG16 提取与多尺度融合生成边缘结果,损失模块优化模型,训练与推理模块实现部署。
图 1 系统结构图

特征提取网络采用 VGG16 作为基础特征提取架构。保留了 VGG16 的前10 层卷积层在各卷积块输出处提取特征。特征提取网络的输出是5 个不同层级的特征图,分别对应 VGG16 的 5 个卷积块。浅层特征保留细节适合检测细小边缘,深层特征具备更高语义抽象能力适合检测语义边缘,为多尺度边缘预测提供全面特征支持。
多尺度边缘预测模块负责从不同层级的特征图中生成边缘预测结果,并最终融合这些结果形成高质量的边缘图。在每个卷积块的输出端引入侧输出层结构,进行逐尺度边缘预测并上采样融合。为充分利用侧输出信息,设计特征融合层,将其在通道维度拼接并经 1×1 卷积生成最终预测图,综合多尺度特征以提升完整性与准确性。推理阶段可输出多尺度结果,兼顾低层与高层任务需求。
由于边缘像素稀少且样本不平衡,传统交叉熵易偏向背景,削弱细节检测。为此,采用平衡交叉熵,动态调整权重以强化边缘像素学习。通过归一化损失,确保总损失的尺度稳定性,避免权重放大导致的梯度爆炸。为了进一步提高模型性能,采用深度监督,在各侧输出层及融合层计算损失并加权求和。平衡交叉熵结合深度监督既突出稀少边缘像素,又促进多尺度一致性学习,显著提升检测准确性与完整性。
3 实验
3.1 数据集及实验环境
选用 BSDS500 作为实验数据集,包含 500 幅自然图像。每幅图像均由多位标注者提供高质量人工边缘标注,为算法的泛化性与鲁棒性评估提供了可靠依据。
3.2 实验结果
边缘检测性能评估采用最佳数据集尺度(ODS)作为主要指标。为验证所提出方法的有效性,与多种经典边缘检测方法进行了对比实验,结果如表 1 所示。
表 1 不同方法在BSDS500 数据集上 ODS 的对比结果

从表 1 可以看出,传统边缘检测算法 Canny 在 ODS 上仅为 0.600,明显低于深度学习方法,说明其在复杂自然场景下对噪声和多尺度边缘的鲁棒性不足。本文方法在ODS 指标的值为 0.768,相比 CSCNN 提升了 1.2% 说明在多尺度边缘融合和深度监督策略的加持下,能够更好地兼顾细粒度边缘与高语义边界的检测。
结论
本研究面向传统方法在多尺度特征融合与语义理解上的不足,以 VGG16 为骨干,在各卷积块加入侧输出层提取浅层细节与深层语义,并经融合层整合生成完整边缘图。引入深度监督可直接优化中间层预测,缓解梯度消失并增强复杂场景边缘捕捉能力。
参考文献
Z. Su, W. Liu, Z. Yu, et al. Pixel Difference Networks for Efficient Edge Detection[C].
IEEE/CVF International Conference on Computer Vision, 2021:5097–5107. F. Li, C. Lin. UHNet: An Ultra-Lightweight and High-Speed EdgeDetection
Network[DB/OL].(2024-08-08) https://doi.org/10.48550/arXiv.2408.04258. M. Pu, Y. Huang, Y. Liu, et al. EDTER: Edge Detection with Transformer[C].
IEEE/CVF Conference on Computer Vision, 2022:1404-1412. G. Bertasius, J. Shi, L. Torresani. Deepedge: A multiscale bifurcated deep network for
top-down contour detection[C]. IEEE Conference on Computer Vision and Pattern
Recognition, 2015:4380-4389. J. Hwang, T. Liu. Pixel-wise deep learning for contour detection[C]. The 3rd
International Conference on Learning Representations, Workshop Track Proceedings. 2015.