立体视觉字面意思是用一只眼睛或两只眼睛感知三维结构,一般情况下是指从不同的视点获取两幅或多幅图像重构目标物体3D结构或深度信息。目前立体视觉3D成像方法可以分为单目视觉、双目视觉、多(目)视觉和光场3D成像等,其中最为典型的便是双目立体视觉3D成像。
图5 Intel实感深度摄像头D455示意图及内部结构图
双目立体视觉方法是利用两个相机从两个不同的视点对同一个目标物体获得两个视点图像,然后计算两个视点图像的视差以此获得目标物体的3D深度信息,如图6所示,该计算过程一般分为以下四个步骤:图像畸变矫正、立体图像校对、图像配准和三角法重投影视差图计算。
图6 双目立体视觉工作原理示意图
这种双目立体视觉3D成像的方法是被动视觉成像的一种,比较依赖于机接收到的由目标场景产生的光辐射信息,已成功应特定条件下的3D测量场景,但场景应用有限,对场景要求较高,比如:目标场景光辐射动态范围较小且无遮挡、目标物体表面光滑或纹理清晰、几何规则明显等。
四、三角测量法
激光三角测量法已经存在了数十年,且目前仍然被广泛使用,其主要作用是测量目标物体上单个点的准确深度。
其工作原理是利用激光光源、目标物体和相机定义一个空间三角形,并通过确定三者之间的相交角度来计算目标物体单个点的3D坐标信息,如图7所示。在此基础上,将其与线扫描技术和面扫描技术相结合便可实现2D和3D的测量。
图7 三角测量法工作原理示意图
三角测量法具有非常高的分辨率和测量精度,其分辨率可扩展到毫米及微米级别,但在实际应用中受相机和激光光源横向距离的限制,并且测量时间较长,仅适用于较短的距离的测量。
五、FMCW法
FMCW法也称为相干3D成像法,是通过一系列连续调制(如正弦调制、平方幅度调制等)的出射激光或LED发射探测光,经目标物体反射后,根据发射和接收信号之间的调制幅度的相移来获得物体距离等信息。
相比于TOF法,FMCW法不依赖于光脉冲的飞行之间和发射光的幅度和功率,而是依赖于窄线宽激光器与相干接收器耦合产生的低功率频率啁啾,具有更高的灵敏度、精度和准确度,并且具有较为优异的抗干扰性,但由于确定相移需要更长的测量和积分时间,且由于相移重复回产生距离歧义的问题,因此该方法仅适用于短距离的测量。
图8 SiLC Technologies的“4D + Vision Chip”FMCW激光雷达传感器示意图
总结
随着对机器视觉系统的研究和探索,它已经在制造业生产、日常生活、以及医疗健康等方面扮演者越来越重要的角色,极大地提高了现有的生产力和自动化水平,必将是我国智能制造中亟需发展和研究的项目。
但该系统较为复杂,涉及多个学科的交叉,比如光学成像、图像处理、自动化、控制等。因此必将出现大量的学科交叉问题及瓶颈,而如何在其中探索出高准确性、实时性和强鲁棒性等性能的复合方案将是研究者和应用企业追寻及探索的方向。