分享:

浅析面部识别技术的发展历程与存在问题

2021-03-23 16:08:12 中国航空报 逸文

面部识别发展的4个历史阶段

这些数据集的形成本身就是一个动态的过程,由政治动机、技术能力和当前规范的变化共同驱动。团队通过分析评估任务、训练数据和度量标准的演变,更清晰地了解评估的内容,从而在部署环境中真正捕获这些系统的可靠表示,以便在现实世界中建立起对这项技术功能更客观、更深入的理解。

首先来看下,这项研究中提到的面部处理技术究竟是指什么。在此,面部处理技术FPT将被视为一个广义的术语,涵盖任何涉及人脸图像的识别和表征的任务,包括人脸检测(face detection)——在图像的边界框中定位人脸的任务;人脸验证(face verification)——对查询图像和给定图像进行一对一的确认;面部识别(face identification)——对查询图像和给定图像库进行一对多的最相似结果匹配;以及面部分析(facial analysis)——一种用于确定面部特征的分类任务,诸如年龄、性别或姿势等身体或人口统计学特征,以及更多的情景特征,如面部表情。

目前,主流的商业面部识别产品仍然主要基于2D静态图像的预测。

因此研究将调查范围限制在现在可用的2D静态图像摄影面部识别基准,即不讨论由红外或其他传感器输出图、草图或绘图数据集、基于视频的数据集、3D图像数据集以及诸如体态识别这样的非视觉人脸图像集。

在本研究中,团队将审核(audit)或评估(evaluation)看作是一系列用于确定特定技术适用性的过程,以实现其在指定部署中的预期使用。显然,该方法独立于此定义,因此评价方法会包含定量和定性两个方面。

而在时间范畴上,由面部识别发展的三个关键性转折点所划分,研究将FBT发展主要分为四个时期。

三个关键性转折点分别是:

(1)于1996年创建面部识别技术(FERET)数据库,它是首个用于学术和商业研究的大规模人脸数据集;

(2) 于2007 年 创 建LFW(Labeled Faces in the Wild)数据集,它是首个源于Web的人脸数据集,主要用于研究非受限情况下的面部识别问题;

(3)于2014年开发DeepFace数据集,它是第一个在人脸验证任务上击败人类表现的面部识别模型,并使用目前主流的深度学习技术进行训练。

面部识别发展的四个阶段及其具体任务依次是:

第一阶段:早期研究阶段(19641995)这个任务借由计算机来实现可以追溯到20世纪60年代。

1964年,Woodrow Bledsoe首次尝试以计算形式进行面部识别任务。在某情报机构的资助下,他通过计算机编程将嫌疑人的身份和面部照片书中的身份联系起来。Bledsoe 最初的方法是用计算出的面部特征之间的距离矢量并对每个人进行编码,这种方法虽然很流行,但是计算成本大、效率低。这在当时的技术条件下,每小时只能处理大约40张图片。

后来,一种名为特征脸(eigenfaces)的新方法,可以实现在低维空间中表示人脸特征的像素强度,成为了一种有吸引力的替代方法。然而,在当时通过获取足量数据来尝试这种新方法,仍十分具有挑战性,因为研究人员将不得不招募、雇佣模特和摄影师,保证拍摄场景设置上的一致性,并手动标记诸如面部关键特征(facial landmarks)的数据。

第二阶段:“新生物识别”的商业可行性阶段(1996-2006)

到1996年,美国政府官员已经承认并接受了这样一个事实:人脸是一种非侵入性的生物特征,可以用于跟踪和识别个人,而不需要他们的主动参与。因此,美国国防部和NIST提供了650万美元的资金,创建了FERET数据集,为研究人员提供在该领域取得进展所需的数据。

在1993年8月至1996年7月期间,基准测试从856个人的2413张静态人脸图像增长到包含1199个人的14126张人脸图像。到了2000年,鉴于FERET数据库成功激发了面部识别领域的研究兴趣,特别是该技术开始迈出商业化步伐,并推动了NIST发布面部识别算法测试(FVRT, the Facial Recognition Vendor Test),这项基准旨在评估新兴的商业系统。

随后,更大、更丰富的数据集层出不穷,诸如支持向量机(SVM, Support Vector Machines)、卷积神经网络(CNNs, Convolutional Neural Networks)和隐马尔可夫模 型(HMMs, Hidden Markov Models)之类的方法,让面部识别任务取得了一些令人鼓舞的成果。但是,早期方法在实际的应用中也存在某些弊端,无法在各种环境中很好兼容,而且算法的准确率和算力仍需要提升。

第三阶段:不受限制的主流开发阶段(2007-2013)

LFW数据集的开发满足了研究人员获取更自然定位和更多样化数据的愿望。该数据集包含1680个人的超过13000张图片,其中涵盖了姿势(poses)、照明条件(illumination conditions)和表情(expressions)的无限组合。

由此,LFW激发了一波用于面部识别模型训练和基准测试的网络人脸数据集的热潮——包括许多未经在线平台同意而获取图像的数据集,比如谷歌图像搜索(Google Image search)、雅虎资讯(Yahoo News)。

随着人们对非结构化、不受约束的“野生”数据需求的增长,像ChokePoint和SCface这样的基准数据也大量涌现,不仅数据集越来越拟合真实世界的情况,FVRT也得到了广泛的发展,从2000年最初实施的1462人的13872张图像增长到2013年1440万人的3020万张静态照片。但是,在不受限制的条件下进行面部识别的研究,仍是一项技术挑战。

第四阶段:深度学习的突破阶段(2014至今)

2012年Alexnet的突破,以及随后在2014年引入DeepFace模型推动神经网络成为了面部识别发展的主流方法。

由Facebook公司开发的DeepFace,是第一个通过深度学习训练的面部识别模型,也是面部识别模型在任务上逼近人类性能的第一个实例。据称,这是“迄今为止最大的面部数据集,一个包含超过4000个身份的400万张面部图像的数据集”。

深度学习技术对面部识别的影响是巨大的;DeepFace模型在LFW测试集上取得了97.35%的准确率,相较于之前的前沿技术方法,在误差率上降低了27%。为了响应这一技术的进步,随后构建的人脸数据集的规模显著增长,目的是适应训练深度学习模型日益增长的数据需求。

这一快速进展也引发了巨大的商业利益。最早的面部识别算法主要面向安全应用,但在商业化上,面部识别产产品已经涵盖索引和搜索数字图像存储库、定制广告精确投放、用户参与监控、客户人口统计分析等。特别是2014年DeepFace模型在面部识别方面取得突破之后,该技术率先引领了商业化浪潮。这一切都建立在广泛发展的面部识别数据集的基础之上。

责任编辑:实习编辑