对于刷脸消费、刷脸解锁这些“黑科技”,人们其实一点都不陌生,但如果要深入其中,普通人也只能说出一个关键词:人脸识别。
而人脸识别技术实际上可以区分为2D和3D两种。
1、2D人脸识别:
2D人脸识别是目前最为常见的人脸识别技术之一,其工作原理是后期人脸识别系统对图片中的人脸进识别,通过设定数百或数千个点,并记录点与点之间的函数,该函数即为此人的面部信息。
2、3D人脸识别:
3D人脸识别是采用3D结构光技术,通过3D结构光内的数万个光线点对人脸进行扫描后,从而提供更为精确的面部信息,而这类面部信息并不会受到口红、粉底等化妆品的影响。与2D人脸识别相比,3D人脸识别将提供更为精确的面部数据,最终让数据更加安全可靠。
“普通视觉传感设备让万物看到世界,而3D传感技术则让万物能像人一样‘看清’世界。”
3D传感技术原理
要谈3D传感技术,就必须先弄清楚光学测量分类以及其原理。
光学测量分为主动测距法和被动测距法。主动测距方法的基本思想是利用特定的、人为控制光源和声源对物体目标进行照射,根据物体表面的反射特性及光学、声学特性来获取目标的三维信息。其特点是具有较高的测距精度、抗干扰能力和实时性,具有代表性的主动测距方法有结构光法、飞行时间法、和三角测距法。
主动测距法
结构光法
根据投影光束形态的不同,结构光法又可分为光点式结构光法、光条式结构光法和光面式结构光法等。
目前应用中较广,且在深度测量中具有明显优势的方法是面结构光测量法。面结构光测量将各种模式的面结构投影到被测物体上,例如将分布较密集的均匀光栅投影到被测物体上面,由于被测物体表面凹凸不平,具有不同的深度,所以表面反射回来的光栅条纹会随着表面不同的深度发生畸变,这个过程可以看作是由物体表面的深度信息对光栅的条纹进行调制。所以被测物体的表面信息也就被调制在反射回来的光栅之中。通过被测物体反射回来的光栅与参考光栅之间的几何关系,分析得到每一个被测点之间的高度差和深度信息。结构光的优点是计算简单,测量精度较高,对于平坦的、无明显纹理和形状变化的表面区域都可进行精密的测量。其缺点是对设备和外界光线要求高,造价昂贵。目前,结构光法主要应用在条件良好的室内。
飞行时间法(ToF)
飞行时间(Time of Flight,简称ToF)法,又叫做激光雷达(LiDAR)测距法。它将脉冲激光信号投射到物体表面,反射信号沿几乎相同路径反向传至接收器,利用发射和接收脉冲激光信号的时间差可实现被测量表面每个像素的距离测量。ToF直接利用光传播特性,不需要进行灰度图像的获取与分析,因此距离的获取不受物体表面性质的影响,可快速准确地获取景物表面完整的三维信息。缺点则是需要较复杂的光电设备,价格偏贵。
三角测距法
三角测距法又称主动三角法,是基于光学三角原理,根据光源、物体和检测器三者之间的几何成像关系来确定空间物体各点的三维坐标。在实际测量过程中,它常用激光作为光源,用CCD相机作为检测器。这种方式主要用于工业勘探、工件表面粗糙度检测、轮胎检测、飞机检测等工业、航空、军事领域,在消费电子类产品还不曾涉及。
被动测距法
被动测距技术不需要人为地设置辐射源,只利用场景在自然光照下的二维图像来重建景物的三维信息,具有适应性强、实现手段灵活、造价低的优点。但是这种方法是用低维信号来计算高维信号的,所以其使用的算法复杂。被动测距按照使用的视觉传感器数量可分为单目视觉、双目立体视觉和多目视觉三大类。
单目视觉
单目视觉是指仅利用一台照相机拍摄一张相片来进行测量。
因仅需要一台相机,所以该方法的优点是结构简单、相机标定容易,同时还避免了立体视觉的小视场问题和匹配困难问题。单目视觉方法又可分聚焦法和离焦法两类。聚焦法是指首先使相机相对于被测点处于聚焦位置,然后根据透镜成像公式求得被测点相对于相机的距离。相机偏离聚焦位置会带来测量误差,因此寻求精确的聚焦位置是关键所在。而离焦法不要求相机相对于被测点处于聚焦位置,而是根据标定出的离焦模型计算被测点相对于相机的距离,这样就避免了由于寻求精确的聚焦位置而降低测量效率的问题,但离焦模型的准确标定是该方法的主要难点。
双目立体视觉
双目立体视觉的基本原理是从两个视点观察同一景物,以获取在不同视角下的感知图像,然后通过三角测量原理计算图像像素间的位置偏差(视差)来获取景物的三维信息。这一过程与人类视觉感知过程是类似的。
在双目立体视觉系统的硬件结构中,通常采用两个摄像机作为视觉信号的采集设备,通过双输入通道图像采集卡与计算机连接,把摄像机采集到的模拟信号经过采样、滤波、强化、模数转换,最终向计算机提供图像数据。一个完整的双目立体视觉系统通常可分为数字图像采集、相机标定、图像预处理与特征提取、图像校正、立体匹配、三维重建六大部分。
多目立体视觉
多目立体视觉系统是对双目视觉系统的一种拓展。
所谓多目立体视觉系统,就是采用多个摄像机设置于多个视点,或者由一个摄像机从多个视点观测三维景物的视觉系统。对多目系统所采集到的景物图像进行感知、识别和理解的技术被称为多目立体视觉系统技术。
在双目立体视觉中,对于给定的物体距离,视差与基线长度成正比,基线越长,对距离的计算越精确。但是当基线过长时,需要在相对较大的视觉范围内进行搜索,从而增加计算量。利用多基线立体匹配是消除误匹配、提高视差测量准确性的有效方法之。基线数目的增加可以通过增加相机来实现。
光电3D影像技术
根据获取图像信息方法的不同,光电3D影像技术分为有源和无源两种技术,无源技术主要是接受物体的辐射或者环境的发射,有源技术是通过投射一束调制的或未调制的光到物体上通过检测物体反射的光来形成3D图像。
以前大多数技术研究集中在无源3D技术上,利用三角测量原理,通过两台相距一定距离的照相机,左边照相机产生的图像表示深度信息,右边照相机产生差异的二维图像。关键是产生深度信息的照相机需要分离出深度信息。无源3D影像技术需要拍摄的物体具有突出的轮廓特点,比如边缘、角、线等。其优点是不需要特殊的硬件条件,并成功使用在好几个方面。这种技术的缺点是需要两台或者更多的高质量的照相机、图像处理软件。图像质量、拍照速度、数据传输等都是这种机制能否被广泛应用的限制因素。
有源3D光电图像方法是投射一束有规律的空间分布的线状光到物体上从而产生一个网状格的深度。广泛使用的有源光方法是飞行时间(time off light)方法,最近几年,市场上出现的3D照相机都是基于飞行时间方法,这些3D照相机主要应用于工业控制,通过飞行时间方法检测相位来实现3D影像。一束几十兆赫兹被调制的近红外光照射到物体上,物体反射的光进入3D照相机,由于立体物体的远近距离不同,反射光的相位存在一个延迟,通过检测原始光束以及反射光束的相位延迟从而检测出物体的景深,从而实现3D图像。这种3D图像传感器的制作由ZMD公司完成,ZMD公司根据3D图像传感器需要高速的特点从噪声和速度进行工艺优化,响应速度可以到100MHz以上。
3D传感技术的应用
其实,除了用于手机的人脸识别,3D传感技术已经应用到了很多方面,在2018中国互联网大会上,有国人厂家推出的智慧家庭新生态解决方案,赋予电视3D人脸识别、精准内容推荐、手势交互等创新功能,颠覆智慧家庭客厅体验。
通过3D人脸识别技术,电视可在不获取用户隐私的前提下,精准识别出机顶盒前的观众的用户画像信息,包括性别、年龄、情绪等等。同时,系统根据登录的用户角色信息,通过综合统计分析该用户角色的行为数据,可为用户提供“千人千面”的个性化EPG界面,精准推荐电视节目、视频点播、游戏应用等内容。
此外,3D传感技术可以赋能各行各业:首先是机器人厂商,尤其是服务性机器人的眼睛需要3D视觉技术,去感知周边的环境,例如目标距离、障碍物等信息;其次是安防厂商,在传统的安防摄像头里面再加装一个视觉传感器,就可以获得一个更加精准的三维立体信息;还有门禁门锁,3D的刷脸识别相比2D的刷脸识别,安全等级和精准性可以提升一级;最后,就手机行业的发展趋势来说,3D传感技术未来的应用空间很大,刷脸等生物识别都离不开3D传感技术,此外VR、AR、美颜也可以搭载3D传感技术去做一些交互性、娱乐性的体验。还有各种各样的智能硬件,凡是需要采集物体深度信息的相关功能,都会用到3D传感技术。