在评估汽车激光雷达系统对周围空间的感知水平时,制造商通常认为确定其探测距离很有价值。为了优化安全性,车载计算机系统应尽可能早地探测到障碍物。从理论上讲,速度决定了控制系统是否可以计划和执行及时的规避措施。AEye认为“探测距离”这个指标是必要的,但还不够。感知系统应该能对目标进行分类并将准确及时的信息传递给控制系统。
最重要的不仅是有多快能探测到目标,而且有多快能识别出目标并进行分类,从而做出威胁级别决策并计算出适当的响应。单点探测无法与噪声进行区分。因此,我们使用行业内对探测的通用定义,即每帧和/或多帧之间的相邻拍摄的持久性。我们要求每帧(在相同探测距离内有五个点)和/或从多帧之间(连续五帧的一个相关点)对一个目标进行五次探测,以验证探测到了有效的对象。在20Hz时,定义一次简单的探测需要0.25秒。
当前,分类通常在感知堆栈中进行,对目标进行标记,并最终对其进行更清晰的识别。此数据被用于预测行为模式或轨迹。传感器提供的分类属性越多,感知系统确认和分类的速度就越快。AEye认为,评估这种关键汽车激光雷达能力的更好方法是影响“目标分类距离”的能力。该指标减少了早期感知堆栈的未知数,如与噪声抑制相关的等待时间,从而确定了重要信息。
作为相对较新的领域,尚未确定汽车激光雷达分类所需数据量的定义。因此,我们建议使用视频分类的感知标准作为参考定义。根据视频标准,采用的分类是基于对象的3 x 3像素网格。在此定义下,可以通过汽车激光雷达系统以多快的速度生成高质量、高分辨率的3 x 3点云来进行评估,使感知堆栈能够理解场景中的物体和人物。
对于传统激光雷达系统而言,生成3 x 3点云是一项艰巨的任务。尽管许多系统都宣称可以在一秒钟内显示100万点甚至更多的点云,但这些图像均匀性不佳。对于分类而言,这些固定采样模式可能很难完成,因为域控制器必须每秒处理100万个点,这在许多情况下与所涉及目标的关键采样所需的分辨率无法平衡。如此广泛的点样本意味着它需要执行其它解释,从而占用大量CPU资源。
图4:在探测物周围排列密集的3 x 3网格可以收集更多有用的数据,并大大加快分类速度。在左侧的“扫描1”(scan 1)中,对车辆进行了一次探测。无需等待下一帧对该车辆进行重新采样(如传统激光雷达的典型操作),而是快速形成动态ROI,如“扫描2”(scan 2)所示。在初始单次探测之后和完成下一次扫描之前,将立即执行。
回到“搜索、采集和采取行动”的架构中,一旦我们获得了目标并确定其是有效的潜在威胁,我们就可以分配更多拍摄进行分类,并在需要时采取行动。另外,如果我们确定目标不是立即威胁,我们可以更全面地询问该目标以获取其它分类数据,或者每次扫描拍摄几次就可以对其进行简单跟踪。
实际用例:无保护左转弯
对不同目标需要不同响应。在具有挑战性的驾驶场景尤其如此,例如在高速行驶过程中的无保护左转弯。想象一下,在四车道道路上的自动驾驶汽车,其时速限制为100公里/小时,在两条行车道上进行无保护左转弯。在迎面而来的交通中,一条车道有摩托车,另一条车道有小轿车。在这种情况下,目标分类距离至关重要,在足够的距离内将一个目标分类为摩托车,高速行驶的自动驾驶汽车会更加谨慎,这是由于摩托车行驶速度较快且路径不可预测。
实际用例:校车(特殊目标)
在特定距离对目标进行分类的意义比即时响应更为重要。一个很好的例子就是遇到一辆满员的校车。该目标被归类为校车的速度越快,自动驾驶车辆启动适当协议的速度就越快——减慢车速并部署其它工具,如在校车周围区域增加瞬时分辨率(触发式ROI),以立即捕获儿童朝车道移动的任何动作。此功能可用于警车、救护车、消防车或任何需要自动驾驶车辆改变询问场景、改变速度或路径的特殊车辆。
结论
在本文中,我们讨论了减少同一帧内对目标探测时间差至关重要的原因。由于需要捕获同一点/目标的多次探测才能完全理解该目标或场景,因此对于汽车激光雷达来讲,目标重访速度是比帧速率更为关键的指标。
另外,我们认为分辨率是不够的。量化瞬时分辨率更加重要,因为智能、高灵敏度的分辨率更有效,并且可以通过更短的响应时间提供更高的安全性,尤其是在将ROI与卷积神经网络配合时。
最后,我们证明了探测距离这个指标远远不够,目标分类距离(即识别和分类目标的速度)更为重要。仅仅量化传感器可以探测到潜在目标的距离还不够。还必须量化从实际事件发生到被传感器探测的延迟,并加上从传感器探测到CPU决策的延迟。在此架构下,激光雷达系统可提供的属性越多,感知系统的分类速度就越快。