缩略图

多目标人脸识别系统的设计与实现

作者

黄志勇

嘉兴秀安电子科技有限公司 浙江嘉兴314000

摘要:多目标人脸识别系统是可以对多个目标同时识别,但是在识别过程中,其识别速度、精确性等都受诸多因素的影响。基于这种情况,为更好发挥多目标人脸识别系统的作用,应当结合现有问题,采取科学合理的方式进行设计,并且充分利用图像采集、算法等完成识别工作,以此满足实际的使用需求。

关键词:多目标人脸识别系统;人工智能;YOLOv3模型

引言:在科学技术持续发展中,人工智能技术得以形成和使用,不断扩大人脸识别技术的应用范围,如安防监控、考勤管理等[1]。现阶段使用的人脸识别技术只能对单一目标识别,但是从使用者要求出发,其要求能够对多个目标识别。基于这种情况,为满足多目标的识别需求,应当设计多目标人脸识别系统,才能更好解决各个行业的问题。因此,在多目标人脸识别系统设计完成后,可以提升识别工作的效率和精度,也可以满足多个场景的使用需求。

一、人脸图像采集

在人脸图像采集工作中,主要利用Dlib库实现[2]。在具体使用中,先导入了Dlib库的数据资料,并且形成了人脸检测模型;再借助外部安装的各个监控设备,逐步获取越来越多的视频资源。在这种过程中,充分发挥人脸检测装置的功能,可以依靠视频资源实时追踪和定位相应的目标,也可以分析出人脸的核心特点。再利用循环方式,能够分析视频资源的全部图像,促使其形成的灰度图像,并依托检测装置发现其中的人脸。在获取到具体的人脸后,开始进行调整处理,提升识别效率和精度[3]。只有得到调整后,就可以将人脸采集和保存。如果采集的图像达到要求后,需要停止采集,也要对监控设备关闭。这种采集方式是对人脸核心特点检测,并且按照核心特点开展定位工作。因此,通过对Dlib库的使用,能够明确人脸采集的流程,主要涉及五个方面的内容:开启监控设备、打开人脸检测装置、采集图像、处理和结束等。在整个过程中,Dlib库可以提供非常强大的功能,这源于其中设计了检测装置,也配置了形状预测工具,能够对具体获取的图像分析,识别到相应的识别,并对其调整处理,以此采集到高质量的人脸图像。

二、多目标人脸检测

在多目标人脸识别过程中,主要利用YOLOv3模型实现[4]。通过该模型的支持下,可以对人脸识别和定位,也可以掌握多个目标的人脸图像。首先,依托WiderFace数据集,因其是各种图像的集中,也对每个图像进行标注,可以掌握每张图像的范围、大小等信息。基于这种情况,开展预处理工作,如调整图像尺寸等。在预处理工作完成后,基本上按照图像的信息,将其划分为两个集合,大约80%数据纳入训练集合,剩余数据全部集中到验证集合。然后,开始搭建模型的网络结构,对各个层次进行确定,如输入层、卷积层等。结合第一个数据集中的种类、数量等,对输出层的模型进行一定的调整。基于模型的权重参数是提前确定的,只需要按照权重开始初始化[5]。并且,利用批量梯度的方式,不断调整优化当前使用的算法。在模型训练中,因各种图像开始持续输入,可以得到相应的损失程度,也可以对模型参数进行调整。在每个训练迭代过程中,都要输入当前掌握的训练集内容,也要开展人脸特点训练,而且要充分发挥验证集的作用,不断对模型进行评估分析。在这种过程中,能够掌握模型的各方面情况,如精度、召回率等,从而得到模型的使用效果。按照模型验证过程的具体表现,需要对模型再次调整优化,也要对其中使用的参数优化,促使模型精度得到持续提升。在该过程中,需要完成的工作很多,如模型评估、参数优化等,促使模型最终符合使用要求。如果模型已经达到预定条件后,就不要开展训练,这就得到了最终的模型,也要将相应参数保存,以此为后续使用奠定良好的基础。

针对该模型的加载,需要先对权重和文件进行配置,才能保障模型的有效利用。一般情况下,需要利用一个函数对模型解译,既可以满足输出的要求,也可以获取置信度,还能够对阈值进行确定,以此得到最终的检验效果。如果输入了需要检测的视频资源后,应当对网络输入进行调整,尤其是大小,让其像素符合检测要求。在预处理过程中,需要将图像输入到模型中,开展传播过程,得到模型输出结果,如位置和置信度。基于得到了预测框的置信度,也掌握了具体的坐标,就可以开始对边界框解码。在该项工作中,先要掌握中心坐标、宽度、高度等,才能得到正确的解码结果。按照预测框而言,因其得到了具体的置信度和分类占比,需要开展非极大抑制,得到最为精确的人脸框。按照具体的要求,需要借助图像资源开展绘制,对最后得到的图像和视频资源保存。非极大值抑制公式是:

边界框重叠度计算公式是:

在上式中,代表边界框集合,代表剩余的边界框;代表二者交界的多少,代表二者相同的面积是多少。

三、多目标人脸识别

在多目标人脸识别中,主要利用SVM模型实现。该模型能够对各个面孔检测,从而提供了人脸识别的功能。在具体使用中,应当建立人脸数据库,并且将其转换为适合该模型训练的格式。在选择采取哪种检测方式,如图片还是视频。如果选择了具体的检测方式,程序就会自动运行,不管是使用什么方式开展检测,最终的检测结果都会保存在指定的目录中。如表1所示,是人脸识别步骤。

在该流程中,利用YOLOv3模型的功能,可以对输入的图片或者视频资源进行检测,并且这种检测过程是针对多个目标的,从而得到了具体的边界框位置,也获取了相应的置信度。针对得到的每个边界框都会使用非极大值进行处理,消除了其中重叠度较高的边界框,从而得到最佳的边界框集合。在这种过程中,需要对得到的边界框进行提取,掌握其中的图像区域,并且将其中的特征向量提取,也要使用训练中采取的标准方法处理。基于SVM模型可以对得到的各个预测人脸图像开展标记,也会按照预测结果确定每个标签、基于这种情况,使用预测概率可以对置信度开展排序工作,借助得到的标签与图像进行一一对应,以此得到了最终的识别结果。

四、结束语

多目标人脸识别系统的设计和实现对多个场景应用提供了良好的技术支撑,从而提升了各项工作的处理效率和质量。但是,在设计过程中,需要从采集、检测、识别三个层面出发,制定较为完善的识别流程,并且结合具体使用情况进行调整优化,才能提升人脸识别的精度,也可以让识别效率越来越高。因此,多目标人脸识别系统采取了多模态的方法形成,可以很好保障识别的精度,也可以为各个场景使用提供新的技术保障,以此满足使用者的需求。

参考文献:

[1]刘春晓,郝萍萍,张文豪,等.基于人脸识别的医疗预约挂号系统的设计与实现[J].现代信息科技,2024,8(18):83-86.

[2]谢晶,翟树彬.基于并行活体检测和人脸识别的身份认证系统研究[J].现代信息科技,2024,8(18):87-90.

[3]闫静杰,孙雯静,顾晓娜,等.基于不对称非局部高效信道注意时空网络的面部表情识别[J/OL].南京邮电大学学报(自然科学版),1-11[2024-10-16].