基于嵌入式Linux的复杂光照人脸实时检测研究
haoteby 2025-05-02 18:29 20 浏览
黄世震1,2,黄志勇1,2
(1. 福州大学 物理与信息工程学院,福建 福州 350116; 2. 福建省微电子集成电路重点实验室,福建 福州 350002)
:为了满足嵌入式设备在复杂光照条件下的人脸检测需求,提出了一种基于光照不变特征的人脸检测方法。该方法先基于Retinex理论提取光照不变分量,再以MBLBP特征进行AdaBoost人脸检测。结合该方法,实现了一种基于嵌入式Linux的人脸实时检测系统。实验与实际使用结果表明,该人脸检测系统具有较高的人脸检出率,且满足实时性要求。
:人脸检测;嵌入式;ARM;Retinex;MBLBP;AdaBoost
人脸检测是人脸识别等脸部分析的基础,其在图像检索、目标定位、视频监控以及智能人机交互等领域具有广泛的应用前景。经过多年的发展,人脸检测技术已经取得了很大的进展。与此同时,嵌入式平台技术突飞猛进,不仅具备体积小、功耗低等特点,而且其运算能力也得到了很大的提高。除了实时性的要求外,光照变化对人脸检测的影响举足轻重。国内外研究者对光照处理方法做了大量的研究,主要可分为光照归一化、人脸建模、光照不变量三类方法。以直方图均衡化为代表的光照归一化方法在一定程度上能够减弱光照变化的影响,但是在复杂光照情况下效果不是很理想。光锥法和球谐函数法等人脸建模方法效果好,但计算量大,难以满足嵌入式平台的实时性要求。本文从光照不变量的角度入手,提出了一种结合Retinex理论和MBLBP算子的AdaBoost人脸检测算法,并在ARM开发板上实现。
1硬件平台构建
本文采用处理器为三星Exynos 4412的ARM开发板作为实现平台,该开发板具有主频为1.5 GHz的CortexA9 CPU,Mali400 GPU,1 GB DDR3 RAM。采用USB摄像头作为视频采集输入设备,LCD触控显示屏作为图形界面显示以及触控操作设备。整个硬件平台架构如图1所示。
在PC上的Ubuntu系统中建立交叉编译环境,裁剪和编译Linux内核、制作根文件系统,并将Bootloader、Linux内核、根文件系统、USB摄像头和LCD触控显示屏等驱动移植到ARM板上。配置NFS,通过以太网实现PC与ARM板的通信。使用SecureCRT软件通过串口对ARM板进行调试操作。
2软件设计
本文的程序设计用到了开源计算机视觉库(Open Source Computer Vision Library, OpenCV),图形用户界面设计采用Qt,因此需对OpenCV和QtEmbedded进行交叉编译并移植到ARM板上。整个软件系统框图如图2所示。
由摄像头的图像传感器将采集到的图像传输到Exynos 4412,经过图像灰度化、尺寸归一化等预处理后,提取光照不变分量,再计算其MBLBP值,通过Adaboost算法进行人脸检测,若检测到人脸则在显示区域进行标记。
2.1图像采集
本文基于V4L2[1]进行视频图像采集程序设计,其流程图如图3所示。
2.2关键算法分析
2.2.1光照不变分量的提取
LAND E H等人[2]在辐照度模型的基础上提出了Retinex理论。物体的颜色不受非均匀性光照的影响,而是取决于物体对不同波长光线的反射能力。图像中的固有属性为其反射分量,图像中的干扰部分为光照分量,可通过去除光照分量保留反射分量,实现光照不变分量的提取。
辐照度模型可用如下公式表示:
I(x,y)=R(x,y)L(x,y)(1)
式中,I(x,y)为采集到的光照图像,R(x,y)和L(x,y)分别表示图像在(x,y)处的反射系数和光照分量。
辐照度模型中,R(x,y)由物体的固有属性决定,与光照无关,因此Retinex理论的重点在于如何获得R(x,y)。
将灰度化的采集图像变换到对数域,通过低通滤波器分离出光照分量,最后用上述获得的对数域图像减去分离出的光照分量获得光照不变分量。
对公式(1)进行对数变换得到公式(2):
I′(x,y)=R′(x,y)+L′(x,y)(2)
式中,I′(x,y)=logI(x,y),表示对数域的采集图像;R′(x,y)=logR(x,y),表示对数域的光照不变分量;L′(x,y)=logL(x,y),表示对数域的光照分量。
这里选用的低通滤波器为极大值滤波器,以保证提取的光照不变分量能有足够的LBP纹理特征供后续人脸检测使用。该滤波器提取图像上(2n+1)×(2n+1)窗口的灰度值,并且将最大的灰度值替换掉当前窗口中心像素点的灰度值,通过该窗口遍历整幅图像求得每个像素点的灰度值。其公式如下:
其中I(x,y)为像素点(x,y)的灰度值,I(i,j)为像素点(i,j)的(2n+1)×(2n+1)邻域内的灰度值。
本文提取光照不变分量的算法流程如图4所示。
2.2.2人脸检测
目前广泛使用的人脸检测方法是VIOLA P和JONES M J[34]提出的以Haarlike特征和积分图方法进行人脸检测的Haar分类器,该方法是基于FREUND Y和SCHAPIRE R E[5]提出的AdaBoost算法。AdaBoost是一种通过迭代的方法将同一训练集训练的不同弱分类器提升形成强分类器的算法。
OJALA T等人[67]提出的局部二值模式(Local Binary Pattern, LBP)是一种图像局部纹理特征描述算子。原始的LBP定义为:对于每幅图像上的像素点在其周围3×3窗口内提取像素值,将周围8邻域的灰度值与窗口中心点的灰度值进行比较,若周围像素点的灰度值大于中心点,则该像素点标记为1,否则为0。用公式表示为:
式中:(xc, yc)为窗口中心点坐标;ic为中心点的灰度值;ip为相邻像素的灰度值。
如图5所示,周围8邻域内的像素灰度值经比较可生成8位二进制数00111101,转换成十进制数为61,该值即为中心像素点的LBP值,可用来反映该区域的纹理信息[8]。
Liao Shengcai等人[9]在原始LBP的基础上提出了MBLBP (Multiscale Block Local Binary Patterns)。与原始LBP进行单一像素间比较不同的是MBLBP采用了子区域块的平均像素值进行比较,较好地对不同尺度的纹理信息进行描述,且具有更好的鲁棒性。
以9×9 MBLBP为例,如图6所示,将一幅图像的每个子区域等分为9块,计算这9块的平均灰度值,按照原始LBP的编码方式将邻域的平均灰度值与中心子区域的平均灰度值进行比较,得到的编码即为中心子区域的特征值。
LBP特征是整数特征,相比Haar特征,其训练和检测速度更快。用LBP特征表征人脸时,对光照变化(除局部剧烈变化之外)不敏感。这一点,在实验中进行了验证。本文进行的人脸检测训练与测试基本流程如图7所示。
3测试与分析
为了验证本文提出的方法的效果,从CMU和MITCBCL数据库中选取了625个未参加过训练的人脸样本(包括不同复杂光照条件下的人脸)作为测试样本集。测试实验结果如表1所示。
通过实验,可得知本文训练的人脸分类器中,MBLBP分类器和IIF+MBLBP分类器的检测速度相比其他两个速度更快。在不同复杂光照条件下,MBLBP人脸分类器的检测率比Haarlike人脸分类器有所提高,但提高并不多,查找漏检的样本发现MBLBP分类器相比Haarlike分类器能够多检测出一些光照变化的样本,但对于光照变化剧烈的样本仍然无法有效检测出。而采用提取光照不变分量的IIF+Haarlike分类器和IIF+MBLBP分类器均能够有效检测出这些光照变化剧烈的样本,且两者的检出率相近。综合检出率与检测速度,在ARM设备上采用IIF+MBLBP人脸分类器进行人脸检测,不仅满足实时性要求,而且能够有效应对不同复杂光照条件下的检测需求。
图8为最终在ARM平台上实现的人脸实时检测系统,图9为该系统在复杂光照条件下的人脸检测效果。
4结论
本文提出了适用于嵌入式设备的复杂光照人脸实时检测的方法,通过基于Retinex理论提取光照不变分量,再以MBLBP特征训练AdaBoost分类器,用该分类器进行人脸检测。实验验证,该方法能够提高复杂光照情况下的人脸检出率,且具备较快的检测速度。最后,在ARM CortexA9平台上实现了摄像头人脸实时检测,经测试与实际使用,整个人脸检测系统效果良好,为后续研究人脸识别以及其他应用奠定了基础。
参考文献
[1] 徐家,陈奇. 基于V4L2的视频设备驱动开发[J]. 计算机工程与设计,2010,31(16):35693572.
[2] LAND E H, MCCANN J. Lightness and Retinex theory [J]. Journal of the Optical Society America, 1971, 61(l):111.
[3] JONES V M. Rapid object detection using a boosted cascade of simple features[C]. Conference on Computer Vision And Pattern Recognition, 2001:511518.
[4] VIOLA P, JONES M J. Robust realtime face detection[J]. International Journal of Computer Vision, 2004,57(2):137154.
相关推荐
- 谷歌开源大模型评测框架正式发布,AI模型评测难题迎刃而解
-
近日科技巨头谷歌正式推出其开源大模型评测框架LMEval,这一创新工具为全球AI开发者和企业提供了标准化的模型评估解决方案。LMEval的发布不仅标志着AI模型评测迈入透明化时代,更通过多项核心技术...
- Android 开发中文引导-动画和图形概述
-
安卓系统提供了各种强大的API,用来将动画应用于界面元素和自定义2D和3D图形的绘制当中。下面的小节大概的描述了可用的API和系统功能并帮助你决定那个方案最适合你的需要。动画安卓框架提供了两种动画系统...
- Qt5 C++入门教程-第12章 绘图(QPainter)
-
QPainter类在Qt5中进行绘图时起着重要作用。绘图操作是通过QPainter类在响应paintEvent方法时完成的。线条在第一个示例中,我们在窗口的客户区绘制了一些线条。line...
- 文创测评︱《如意琳琅图籍》:本土原创解谜书的胜利?
-
设想这样一个场景,你打开一本书,就化身为乾隆三十六年紫禁城中的画画人周本,有一天你在故纸堆中找到一本神秘的《如意琳琅图籍》,踏上寻宝旅程,历经各种离奇复杂的故事……这是故宫与奥秘之家联手打造的创意解谜...
- gif动图制作攻略!快快收藏(求gif制作的动图)
-
有事没事斗图玩是当下人们乐此不疲的事情,手里的gif动图也渐渐成为了人们抬杠互怼的一大资本。好有趣,好炫酷,gif是怎么做出来的?我也想做。什么?你不会?没关系,我来教你!首先介绍一下制作gif动图需...
- eduis未能初始化界面 无法启动 问题解决办法
-
1.如果edius安装后启动后出现failedtoinitializeskin中文提示无法初始化界面的错误。这说明你的电脑安装了双显卡,而edius所使用的是图形显卡。可以选择edius图标右键...
- Flash Player模拟器更新:Rufffle(flash模拟器安卓下载高版本)
-
Ruffle是一个适用于WindowsPC的FlashPlayer模拟器,用Rust编写。Ruffle作为一个独立的应用程序在所有现代操作系统上原生运行,并通过使用WebAssembly在所有现代...
- 支持终身免费4G流量,星星充电7kW星际智能交流充电桩拆解
-
前言近期星星充电推出了一款星际智能交流充电桩,在正面设有灯条,可根据灯条颜色和显示直观了解充电状态,并设有屏幕显示充电状态和ui表情。充电桩支持220V/7kW充电功率,适配主流新能源车型。并支持终身...
- 乐动随心之fancy pop(乐动随心壶多少钱一个)
-
跳动飞扬的音符像是连通人与人之间心电感应的通关密码,融化陌生,拉近彼此。此次我们邀请到宅男女神江语晨,化身音乐精灵。在歌手、演员身份间游刃自如的她,为我们生动诠释了三种不同的音乐时尚风格,娴静可爱,灵...
- Asus Zenflash 手机也能玩引闪,从此相机是路人
-
在讲解Zenflash之前,不得不提索爱的K750c,这个机器采用了氙气闪光灯,让手机的拍摄上了档次,可玩性更高,不过,说实话,当时手机的摄像头像素低,成像一般,没有掀起太大的波澜,可现在,手机的Cm...
- Axure有哪些鲜为人知的使用技巧?(axure的使用教程)
-
阿拓带你飞:不管是想入门产品经理还是已经是PM的人对AXURE都很关注,它是制作产品原型的重要工具,但是有多少人了解AXURE的使用技巧?本文是来自“知乎问答”整理的回答,一起来看看那些不常用的使用技...
- 挑战黑夜 华硕ZenFlash氙气闪光灯评测
-
【机锋配件】说到摄影,相信许多朋友都非常喜欢,不管是外出游玩拍拍风景,还是和朋友之间聚会,都会掏出手机拍两张,在餐前拍照晒朋友圈更是成为了许多用户的日常爱好,就算不是专业的摄影爱好者,大家也都有一颗热...
- WPS 演示倒计时 3 步设置!从数字动画到进度条全场景教程
-
做PPT时想添加倒计时却找不到入口?WPS演示自带的"动画+计时"功能就能轻松实现——无论是课堂互动的30秒答题倒计时、商务汇报的5分钟限时讲解,还是活动暖场的动...
- flash动画an制作MG动画元素如何调节透明度,小白...
-
如何在flash动画软件里面调节mg动画元素的透明?因为flash动画软件现在已经升级为flash动画软件,所以直接用新版flash动画软件开工,基本功能都差不多,只是flash增加很多智能化、人性...