基于局部二进制模式的人脸表情识别
赖宥甯 王楷鸿 兰锦锋 梁建锋 林其龙 通信作者崔智
广州工商学院
摘要:在当下信息技术飞速发展的大背景中,人脸表情识别这项于人工智能领域有着重大影响的技术成果是备受瞩目的焦点。其能够以极高的精准度去捕捉并解读人类面部表情背后所蕴藏的丰富情感信息,这种能力让其具备非同寻常的实用价值。近年来,基于局部二值模型(LBP)的特征提取方法在人脸识别领域获得了较高的成效,本文是以基于局部二值模型(LBP)的方式对人脸表情识别进行了深入研究,分别对人脸表情识别和局部二值模式(LBP)进行介绍并联系。
关键词:人脸表情识别;技术特征;局部二值模式(LBP)
引言
人工智能技术快速发展让人脸表情识别技术大步前进,其以计算机视觉、机器学习等理论为基,它在人机交互领域有着不可忽视的应用价值,能让机器更好地理解人类情感,实现更自然、流畅的交互体验,如智能客服可根据用户表情调整服务策略,提升服务质量。在情感计算方面,该技术可精准分析人类情感状态,为心理健康评估、情感障碍治疗等提供有力支持。对于孤独老人等特殊群体,陪护机器人借助人脸表情识别技术,能更贴心地理解和陪伴他们。人脸表情识别还能应用于安防、教育、娱乐等多个领域,是推动人工智能技术发展、拓展应用场景的关键技术之一,具有重要的研究意义。
一、人脸表情识别的技术特征分析
(一)特征提取方法
人脸表情识别进程里提取反映表情变化的特征是重要一环,需要从图像数据中挖掘出能代表人表情状态的属性。几何特征与纹理特征是两大主流方式,几何特征重点在于面部关键点定位及和参照构架的几何关系,如眼、鼻、嘴等部位空间布局及变化规律,这些数据可揭示关键面部结构间的距离、角度等,该方法因具直观性结果解释性强,学术界常用主动形状模型(ASM)、主动外观模型(AAM)等方法。而纹理特征关注面部皮肤微细纹理,更易捕捉表情变化时动态变化的皮肤纹理特征,如局部二值模式(LBP)、灰度共生矩阵(GLCM)等常用纹理描述方法能对皮肤表面纹理进行量化编码或统计,探测表情变化时表面纹理微妙差异,其在辨识轻微表情变化上表现出色。
(二)实时性表现
所谓实时性,即系统要能在较短时间内完成人脸表情的识别任务。影响人脸表情识别系统实时性的因素不少,如算法复杂度、硬件设备性能以及数据传输速度等都在其列。单说算法复杂度,基于深度学习的算法往往计算复杂度颇高,需要大量计算资源来完成模型训练和推理。以卷积神经网络为例,处理大规模图像数据时要进行大量卷积运算,使得处理时间不短。为此,研究者提出一些轻量级深度学习模型,如MobileNet、ShuffleNet等,它们凭借减少模型参数数量以及计算量,在保证一定识别准确率的情况下,让处理速度显著提升。再看硬件设备性能,高性能GPU能够加快深度学习模型的计算进程,以此提高识别速度,还有些专用硬件设备(如FPGA)也被用于人脸表情识别系统,为的是达成实时处理。至于数据传输速度这一方面,在实际应用当中,人脸图像或视频数据要从采集设备传输至处理设备,一旦数据传输速度迟缓,处理就会延迟。所以研究者多会采用高速网络接口或优化数据传输协议来提高其速度。并且,要进一步优化人脸表情识别技术的实时性表现,还可运用多线程处理、并行计算等技术,将不同处理任务分至多个处理器或线程同时处理,进而提高整体的处理效率[1]。
二、局部二进制模式(LBP)概述
(一)LBP的基本原理
局部二进制模式(LBP)最初由Ojala等人于1994年提出,是一种高效的图像局部纹理特征描述符。其基本原理是以图像中的每个像素为中心,取其邻域像素的灰度值与该中心像素灰度值进行比较。若邻域像素灰度值大于或等于中心像素灰度值,则将该位置编码为1,否则编码为0。如此,围绕中心像素的邻域像素会形成一个二进制序列,将此二进制序列转换为十进制数,即得到该中心像素的LBP编码。通过这一过程,LBP能有效地捕捉图像局部的纹理信息,为后续的图像分析等任务提供关键特征[2]。
(二)LBP的优势
LBP在纹理分析领域优势显著。它计算速度快,只需进行简单的像素灰度值比较与二进制转换,操作简便,实时性高。其旋转不变性使得图像发生旋转时,LBP特征仍能保持稳定,对于拍摄角度不同的人脸图像,可有效避免因旋转带来的特征变化。而灰度不变性则让LBP在光照条件变化的情况下,也能准确描述图像纹理,这对于人脸表情识别中复杂的光照环境具有重要价值,能提高表情识别的准确性和鲁棒性[3]。
三、实验结果
此次实验是进行了基础的人脸表情识别。人脸表情分为很多种,在2014年3月31日在美国《国家科学院学报》上发表中指出,人脸表情至少有21种,基本表情6种,复合表情15种。本实验主要进行对3种表情进行了识别,分别是正常表情,大笑表情和微笑表情。我们会收集以上三类表情组成自己的人脸数据库,实验开始时,首先从人脸数据库中选定一张人脸图像作为采集图像,经过预处理和识别等操作获取其特征,之后与数据三个表情其中一个比较两者之间特征值,若在阈值之内则认为匹配成功,否则继续与数据中剩下的表情进行特征值对比,直到匹配成功后,会在表情照片中标出相对于表情。实验结果如图1、图2所示。
参考文献:
[1]包涵,胡卫星.人脸表情识别的技术特征及其教育应用场景分析[J].电子产品世界,2023,30(3):39-43.
[2]许涵坤,郭明,周坤,邱建龙.基于多阶段特征融合的人体动作情感识别方 法[J/OL].南通大学学报(自然科学版)
[3]李根,岳望.复杂光照下LBP人脸识别算法的改进[J].信息与电脑,2023,35(15):106-109
项目:2023-2024学年校级质量工程(大学生创新创业训练计划项目(2022级))-基于局部二进制模式的人脸表情识别,项目编号XJ202313714184。