缩略图

论基于Yolo v8的陶瓷釉料线条打印质量检测系统的研发与应用

作者

戴骏东 吴庆亮 贾子熙

景德镇陶瓷大学

作者介绍:

1.戴骏东 男 2002年5月7日 江西宜春人  景德镇陶瓷大学  2021级自动化专业在校本科生  研究方向:自动化

2.吴庆亮 男 2005年2月14日 江西赣州人 景德镇陶瓷大学  2022级机械设计制造及其自动化专业在校本科生 研究方向:机械设计制造及其自动化

3.贾子熙,女,2006年8月6日,江西南昌人,景德镇陶瓷大学,2024级人工智能专业在校本科生,研究方向:人工智能

基金项目:本论文系景德镇陶瓷大学2024年国家级大学生创新创业训练项目《基于Ultralytics YOLOv8的陶瓷釉料打印质量检测系统》阶段性成果,项目编号为:202410408045X

摘要

随着陶瓷制造业的快速发展,陶瓷釉料打印质量成为了决定产品竞争力的关键因素之一。然而,传统的陶瓷釉料打印质量检测主要依赖人工操作,存在效率低下、误差率高等问题。针对陶瓷釉料线条打印质量检测中人工检测效率低、漏检率高的问题, 通过优化网络结构(引入C2f模块、无锚框设计)和改进损失函数(Wise IOUv1),显著提升了缺陷检测性能。研究构建了包含2037张图像的专业数据集,涵盖线条流畅性、粗细不均及气泡/裂缝三类缺陷,并进行了标准化预处理。实验结果表明,系统对线条流畅性缺陷的检测准确率达77%,整体召回率在低置信度阈值下可达0.94,验证了模型的高效性和鲁棒性。该研究为陶瓷制造业智能化质检提供了有效解决方案,同时为工业表面缺陷检测领域提供了技术参考。

关键词:YOLOv8 深度学习 缺陷检测 质量评估

With the rapid development of the ceramic manufacturing industry, the quality of ceramic glaze printing has become a key factor determining product competitiveness. However, traditional ceramic glaze printing quality inspection primarily relies on manual operations, which suffer from inefficiency and high error rates. To address the issues of low efficiency and high missed detection rates in manual inspection of ceramic glaze line printing quality, this study significantly improves defect detection performance by optimizing the network structure (introducing the C2f module and anchor-free design) and refining the loss function (Wise IOUv1). A specialized dataset comprising 3,037 images was constructed, covering three types of defects: line smoothness, uneven line thickness, and bubbles/cracks, with standardized preprocessing applied. Experimental results demonstrate that the system achieves a detection accuracy of 77% for line smoothness defects, with an overall recall rate of 0.94 at low confidence thresholds, validating the model's efficiency and robustness. This research provides an effective solution for intelligent quality inspection in the ceramic manufacturing industry while offering technical insights for industrial surface defect detection.

Keywords: YOLOv8, deep learning, defect detection, quality assessment

第一章 引言

随着陶瓷制造业的快速发展,陶瓷釉料线条打印质量成为了决定产品竞争力的关键因素之一。陶瓷釉料线条打印是高端陶瓷制品生产的关键环节,其均匀性、无缺陷性直接影响产品的市场价值。

陶瓷釉料线条打印过程中的表面缺陷(如气泡、裂纹、)直接影响产品的合格率,目前,国内陶瓷企业主要依赖人工目检或接触式测量仪进行质量评估,平均每件检测耗时5-8秒,且漏检率高达15%-20%。随着工业智能化升级,传统方法已难以满足高精度、高效率的生产需求。

随着计算机视觉和深度学习技术的快速发展,基于这些先进技术的自动化检测方法逐渐成为研究热点,深度学习,尤其是卷积神经网络(CNN)在目标检测领域的应用,已经显示出在处理复杂图像任务上的显著优势。YOLO(You Only Look Once)系列算法,因其高效的检测速度和良好的准确性,成为近年来研究的热点。从YOLOv1到YOLOv8,每一个版本的更新都在不断优化模型性能,提高检测的准确性和速度,以适应更加复杂多变的应用场景。

YOLO算法自提出以来已经经历了多次迭代更新,从YOLOv1到YOLOv8,每个版本都在性能、速度和准确性上有所改进。这些改进包括网络架构的优化、损失函数的调整、多尺度训练策略的应用等,使得YOLO系列算法能够更好地适应不同的检测任务,包括复杂多变的陶瓷釉料表面缺陷检测。除了YOLO系列之外,还有其他基于深度学习的检测算法如SSD、Faster R-CNN等也被应用于此领域,但是由于YOLO算法在速度和效率上的显著优势,使其成为更适合实时检测应用的选择。

在陶瓷釉料缺陷检测领域,采用YOLO算法可以实现对陶瓷釉料表面缺陷的快速识别和定位,从而大大提高生产效率和产品质量。然而,陶瓷釉料缺陷检测面临的挑战包括缺陷类型多样、缺陷形态复杂、背景干扰等,这要求算法不仅要具有高准确度,还需要强大的泛化能力和鲁棒性。

基于YOLO算法的陶瓷釉料缺陷检测技术,正成为陶瓷行业向智能制造转型的关键。它不仅能够显著提升产品质量和生产效率,还为陶瓷行业的自动化和信息化建设开辟了新的道路。未来的研究将继续探索更加高效和准确的算法模型,以及更加适合陶瓷领域应用的技术创新。

综上所述,陶瓷釉料表面缺陷检测不仅在工业生产中具有重要的实际应用价值,同时也是计算机视觉和深度学习领域中的重要研究方向。通过持续的技术创新和方法改进,以及算法性能的不断优化,将大大推动陶瓷釉料表面缺陷检测向着更高精度、更高效率的方向发展,为保障工业产品质量和生产安全提供有力支持。

本文以YOLOv8算法为基础,开发了一款针对陶瓷釉料线条 打印质量的检测系统。该系统能够精准检测陶瓷釉料以及是否存在气泡,裂纹,色差等缺陷。通过智能化分析,本系统旨在揭示并改善市面上现有的陶瓷打印机可能存在的釉料打印不均匀、气泡等问题,从而提高打印出的陶瓷产品的整体质量。

第二章YOLO各代算法的比较

近几年,以YOLO系列为代表的目标检测算法,在缺陷检测中展示了卓越的性能和广阔的应用前景。YOLOv4的出现,为实时目标检测设置了新的标准。通过采用更有效的特征提取网络和结合空间金字塔池化等技术,YOLOv4不仅在检测速度上保持了高效率,而且在准确率上也有了显著的提升。随后,YOLOv5的推出,进一步优化了模型结构和训练过程,使得模型在更小的计算开销下,仍能保持良好的检测性能。此外,针对小目标检测的难题,研究者们提出了多尺度训练和检测技术,有效地提高了模型对小尺寸缺陷的识别能力。

YOLOv6和YOLOv7的研究,更是将目标检测的性能提升到了一个新的高度。这些版本通过引入更为复杂的注意力机制和特征融合策略,显著增强了模型对复杂场景下缺陷的检测能力。这些改进使得模型能够更好地区分缺陷和背景之间的细微差异,从而提高了检测的准确性和鲁棒性。

YOLOv8算法,作为目前先进的目标检测模型之一。它在继承了前几代YOLO优点的基础上,采用了最新的深度学习技术,如Transformer结构,进一步优化了特征提取和目标定位的能力。这些技术的应用,使得YOLOv8在处理高分辨率图像时,能够更加准确地识别和定位陶瓷釉料上的各种缺陷,即使是在极其复杂的背景下也能保持高准确率。

第三章 YOLOv8算法介绍

YOLOv8作为一款先进的目标检测算法,代表了YOLO系列算法的最新进展。它继承了YOLO(You Only Look Once)系列算法的核心理念——即在单次推断中同时进行目标的定位和分类。YOLOv8对YOLO系列的架构进行了进一步的优化和改进,提高了在各种场景下检测对象的准确性和速度。

YOLOv8算法是一种端到端的目标检测算法, 其结构由主干网络(Backbone)、 特征融合网络(Neck) 和头部网络(Head)三部分组成, 基于先前的YOLOv5 算法,YOLOv8引入了新功能和改进。首先在主干 方面, 使用的依然是跨阶段部分网络(Cross Stage Partial Network,CSP)思想, 但将YOLOv5中的C3 模块替换成了C2f模块, 增加了多个跳转链接和分 割操作, 提供了丰富的梯度流信息, 进而获得更 高的精度和更合理的延迟。在颈部网络部分, YOLOv8 将 YOLOv5 中 PAN-FPN(Path -Aggregation Network-Feature Pyramid Network)上采样阶段中的卷积结构删除了, 使得计算量减少。

在Neck部分,引入了SPP(Spatial Pyramid Pooling)和CFP(Coarse-to-fine)结构,这些结构使得网络能够捕捉不同尺度的特征,增强了模型对于不同尺寸目标的检测能力。SPP通过不同尺度的最大池化来聚合上下文信息,而CFP结构则进一步细化了特征,使得特征在多尺度上都能够有效地被网络学习和利用。

在Head部分,采用解耦的输出头部分别进行类 别和边界框的回归学习。此外,抛弃了以往的锚框方式, 使用了无锚框的思想。损失函数使用Wise IOUv1, 将边界框的回归坐标视为一个分布进行预测, 解决了边界模糊的问题。

在Backbone部分,YOLOv8采用了CSP结构。通过将网络层分割并跨阶段连接,实现了计算负荷的减少和特征信息的增强。这种设计允许部分特征直接传递到网络的深层部分,减少了冗余计算并提高了特征的利用效率。特别是在处理高维度特征时,CSP结构能够更有效地维护特征的丰富性,为后续的特征提取和识别提供了更为鲁棒的基础。

在算法的训练过程中,YOLOv8还引入了Task Aligned Assigner和Distribution Focal Loss来进一步优化性能。Task Aligned Assigner负责为每个预测框分配最合适的目标,它通过考虑任务的特性和目标状态来选择最合适的预测框,而不是简单地根据预测框和目标之间的重叠程度(IoU)。Distribution Focal Loss则是一种新颖的损失函数,它不仅关注于正确分类的损失,还关注于错误分类的概率分布,提供更精细的损失权重调整,以提高模型的识别准确率。

总之,YOLOv8的设计理念是提高算法的准确性和实时性,使其在实时的目标检测任务中表现出色。通过先进的网络结构、损失函数以及标签分配策略,YOLOv8在目标检测领域中实现了快速、准确的检测,特别是在处理复杂场景和小目标检测方面有显著的优势。这些特性使得YOLOv8成为陶瓷釉料线条打印质量检测系统中不可或缺的一部分。

第四章 数据集处理

在本研究中,我们精心构建并使用了一个专门用于陶瓷釉料线条打印质量检测的数据集,该数据集包含2037张图像,细分为862张训练图像、592张测试图像以及583张验证图像。此数据集经过严格的筛选和预处理,以确保模型训练和验证的质量。为了适配深度学习模型的输入需求,我们对每张图像应用了一系列预处理步骤。首先,我们自动调整了每张图像的像素方向,并去除了EXIF方向信息,以统一图像的朝向。随后,所有图像被统一缩放至640x640像素的尺寸,采用拉伸的方式以保持统一输入规格,这对于保持算法处理速度至关重要。通过这三个数据子集,我们确保了模型训练的充分性,验证过程的准确性,以及测试结果的可信度。

针对数据集的缺陷标注,我们定义了3种类别的标签:线条流畅(class_0)、、线条粗细不均(class_1),线条存在气泡或者裂缝(class_2)并赋予它们中文名称以提高标签的可读性和理解性。这些类别不仅涵盖了陶瓷釉料线条表面最常见的缺陷类型,也为算法提供了明确的分类任务。

总体来说,我们的数据集经过了精心设计和预处理,旨在为陶瓷釉料线条缺陷检测任务提供一个全面、平衡的数据基础。详细的类别标注和丰富的样本分布确保了算法训练的有效性,以及后续模型评估的广泛性和可靠性。通过这些准备工作,我们为开发出能够在各种工业环境中准确执行任务的高效算法打下了坚实的基础。

第五章 实验结果与分析

第一节 实验环境

实验环境基于Python 3.11.9,在Windows11环境中使用 PyTorch 2.3.1框架实现。使用的处理器是第12代英特尔酷睿 i5-12400F,NVIDIA GeForce RTX 3060 12G GPU用于训练和测试。在对图像进行预处理时,图像的宽度和高度设置为 1024×1024,批量大小为4。模型训练周期为100轮。使用自 适应动量的随机优化算法(Adam) ,初始学习率为0.01,最终 学习率为0.001,动量为0.937,权重衰减设置为0.0005。在 训练阶段应用了马赛克数据增强,为了加快数据收敛,在训 练的最后10个周期关闭马赛克数据增强。

为了验证本文算法对于工业领域检测的适用性,在C++ 环境中进行部署。使用的处理器是第12代英特尔酷睿i5 12400F,图像处理器为RTX 3060 12G。主要的软件配置:实验环境为Python3.12.3标准,ONNX Runtime-GPU版本为 1.18.0,OpenCV版本为4.8.1,推理时使用CUDA 11.8进行推理加速。

第二节 训练曲线

在深度学习模型的训练过程中,损失函数的变化和评估指标的表现是我们评价模型性能的关键。上图展示了YOLOv8算法的陶瓷釉料线条表面缺陷检测模型在训练过程中的各项指标变化,包括损失函数和精度指标。

从损失函数的角度分析,模型有三种类型的损失:定位框损失、类别损失和置信度损失。在训练集和验证集上,这三种损失随着训练周期的增加而稳步下降,表明模型在逐步学习并改善其对陶瓷釉料线条表面缺陷的检测能力。特别是定位框损失的下降,直接反映了模型在定位缺陷方面的性能提升。不过,值得注意的是,验证集上的损失下降速度略慢于训练集,这可能是由于模型对训练数据过拟合,或者验证集中存在更多复杂样本的结果。

在精度指标方面,我们可以看到Precision(精确率)、Recall(召回率)以及MAP(平均精度均值)指标。在训练过程中,这些指标存在波动,但总体趋势向好。精确率的波动表明模型对正样本的预测在稳定性上还有提升的空间,可能是因为正负样本比例不平衡或某些缺陷类别较难识别造成的。召回率相对平稳的上升表明模型对实际缺陷的识别能力在增强,这对于缺陷检测来说是至关重要的。

MAP是评估检测模型性能的重要指标之一,它考虑了各种阈值下的精确率和召回率。从图中我们可以看到,在不同的IOU阈值下,MAP指标随着训练的进行有所提高,说明模型对于不同大小和形状的缺陷都有了更好的检测能力。但MAP的波动也提示我们,模型可能在某些特定阶段对于特定类别的缺陷检测效果不稳定,需要进一步分析和调优。

综合以上分析,我们可以得出模型整体上是在有效学习的,损失函数的下降趋势和MAP的提高都证明了这点。然而,各项指标的波动也暗示我们可能需要对模型的训练过程做进一步的细化和优化,比如调整学习率策略、增加数据增强方法或采用更精细的类别平衡策略等,以提高模型在验证集上的泛化能力和稳定性。通过这样的分析,我们不仅能够评估模型当前的性能,还能够为模型的进一步开发提供有价值的指导。

第三节:PR曲线图

精确率-召回率(Precision-Recall, PR)曲线是机器学习中评价分类器性能的重要工具,尤其在数据集类别不平衡时比接收者操作特征曲线(Receiver Operating Characteristic, ROC)曲线更为有效。PR曲线描述了精确率(Precision)与召回率(Recall)之间的关系,理想状态下,这两者的值越接近1越好。

提供的PR曲线图可以看出,整体召回率(all classes) 在极低置信度阈值(0.000)时达到 0.94,这表明模型几乎检测出了所有真实目标。而我们的模型在不同类别上的表现存在显著差异,对于线条粗细不均的缺陷(class_1),模型的表现最好,这表明在检测线条粗细缺陷时,模型具有较高的精确率和召回率。

另一方面,线条存在气泡或者裂缝(class_2)的检测性能较差,这可能是由于数据集此类样本数量较少,或者气泡或裂缝缺陷的特征在模型中没有被有效学习。而线条流畅(class_0)虽然优于孔洞缺陷,但仍然表明在检测此类缺陷时有很大的提升空间。

总体来看,尽管模型在某些缺陷类型上表现不错,但在其他类型上还需进一步优化。对于孔洞缺陷的检测问题,我们可能需要收集更多的数据,或者探索更高级的特征提取技术,以提高模型的泛化能力。此外,针对模型整体性能的提升,我们可以考虑更复杂的模型架构,或者尝试不同的训练策略,如改变损失函数的权重,以增加对少数类别的关注。总之,通过PR曲线分析,我们不仅可以发现模型在不同类别上的性能差异,而且可以针对性地调整训练策略。

第四节 混淆矩阵

混淆矩阵是机器学习领域评估分类模型性能的重要工具之一,尤其在目标检测任务中,它能够提供模型在不同类别上的识别能力的直观视图。在我们的输电设备检测任务中,混淆矩阵揭示了模型对各种状态设备的检测效果。

从我们得出的混淆矩阵我们看出,对于线条流畅(class_0)模型表现出较强的判别能力,达到77%的准确识别率,展现出良好的特征捕捉能力。不过,我们同样也注意到,线条粗细不均缺陷(class_1)与线条流畅(class_0)存在16%的交叉误判,提示这两个类别可能存在某些相似特征值得进一步探究。

在线条粗细不均缺陷(class_1)识别方面,我们的模型达到了50%的准确率,同时我们也发现有40%的样本被归类为背景,这也提示我们需要加强模型对该类别的特征学习。而背景类别的识别整体稳定,但存在35%被误判为线条流畅(class_0)的情况,说明模型对线条流畅(class_0)的特征响应可能过于敏感。

这些分析结果为模型优化提供了明确方向:首先,可以通过针对性数据增强来强化线条粗细不均缺陷(class_1)的特征表达;其次,调整损失函数中的类别权重可能有助于改善类别不平衡问题;最后,优化特征提取网络结构有望提升整体的分类性能。这些改进措施将有效提升模型在线条粗细不均缺陷(class_1)和背景识别方面的表现,使模型达到更均衡的识别效果。

第六章 结论

本研究基于YOLOv8算法开发的陶瓷釉料线条打印质量检测系统,通过深度学习技术实现了对三类主要缺陷(线条流畅性、粗细不均、气泡/裂缝)的智能化检测。实验结果表明,系统对线条流畅性的识别效果最佳,准确率达77%,展现了优异的特征提取能力;对线条粗细不均的检测准确率为50%,但存在40%误判为背景的问题;而对气泡或裂缝)的识别性能相对较弱,主要受限于样本数量不足和特征复杂性。通过训练曲线分析发现,模型整体收敛良好,但验证集损失下降较慢提示可能存在过拟合风险。PR曲线显示在低置信度阈值下召回率可达0.94,但不同类别间性能差异显著。混淆矩阵进一步揭示了线条粗细不均与线条流畅性存在16%的交叉误判,以及背景误判为线条流畅性的问题。针对这些发现,后续优化将重点从三个维度展开:数据层面扩充气泡或裂缝样本并优化标注质量,算法层面改进特征提取网络结构和动态损失函数,工程层面提升系统实时性以适应产线需求。本研究不仅验证了YOLOv8在工业质检领域的适用性,其提出的多维度优化方案也为其他表面缺陷检测任务提供了可借鉴的技术路径,对推动传统制造业的智能化升级具有重要实践价值。

参考文献

[1]张澎涛,张宪奇,黄建平,等. 基于YOLOv8n的烟支缺陷检测算法及部署 [J/OL]. 计算机应用, 1-9[2025-04-08]

[2] 张惠,韩跃平,李瑞红. 基于改进YOLOv8的钢材质表面缺陷检测 [J/OL]. 测试技术学报, 1-10[2025-04-08].

[3] 杨祥,王圣凯,董明刚. 基于改进YOLOv8的织物缺陷检测算法 [J/OL]. 桂林理工大学学报, 1-14[2025-04-08].

[4] 化春键,李秀琴,蒋毅,等. 基于YOLO-CFD的棉布微小微弱缺陷检测研究 [J/OL]. 电子测量与仪器学报, 1-12[2025-04-08].

[5] 仝卫国,蔡天娇,王用沛,等. 基于YOLOv8改进的风机叶片小尺度缺陷检测算法 [J/OL]. 电气工程学报, 1-10[2025-04-08].

[6] 陈顺龙,廖映华,林峰,等. 基于改进YOLOv8n的液晶屏Mura缺陷检测 [J]. 液晶与显示, 2025, 40 (03): 439-447.

[7] 梁礼明,龙鹏威,金家新,等. 基于改进YOLOv8s的钢材表面缺陷检测算法 [J]. 浙江大学学报(工学版), 2025, 59 (03): 512-522.