首页 > 网络 > 网络热点

一文读懂BEV空间内的特征级融合

常驻编辑 网络热点 2022-07-12 特征   真值   空间   传感器   模型   图像   视觉   目标   数据   信息
xLJ拜客生活常识网


xLJ拜客生活常识网

xLJ拜客生活常识网

相机和激光雷达前融合效果示意图(来自驭势公众号)xLJ拜客生活常识网


xLJ拜客生活常识网

坐标系的不同,也导致前融合的效果并不理想,一方面,前融合需要处理的数据量较大,对算力要求较高;另一方面,前融合要想达到好的效果,对融合策略要求较高,过程非常复杂,所以目前业内应用并不多。xLJ拜客生活常识网


xLJ拜客生活常识网

为了解决异构传感器坐标系不一致的问题,开发人员常常会把视觉2D图像转到3D坐标系下,这样就和其他传感器数据,如激光雷达点云数据,所在的空间保持一致,从而可以在相同坐标系下进行融合。xLJ拜客生活常识网


xLJ拜客生活常识网

将视觉信息转换到3D坐标系,就是今天介绍的重点——BEV。xLJ拜客生活常识网


xLJ拜客生活常识网

BEV是鸟瞰图(Bird’s Eye View)的简称,也被称为上帝视角,是 一种用于描述感知世界的视角或坐标系(3D),BEV也用于代指在计算机视觉领域内的一种 端到端的、由神经网络将 视觉信息,从图像空间转换到BEV空间的技术。xLJ拜客生活常识网


xLJ拜客生活常识网

虽然理论上BEV可以应用在前、中、后融合过程中,不过因为前融合实现难度大,一般很少将BEV应用在前融合,偶尔也会用在后融合上,更多会应用在介于数据级融合和目标级融合之间的特征级融合,即中融合上。xLJ拜客生活常识网


xLJ拜客生活常识网

3、传感器中融合(特征级融合)xLJ拜客生活常识网


xLJ拜客生活常识网

所谓中融合,就是先将各个传感器通过神经网络模型提取中间层特征(即有效特征),再对多种传感器的有效主要特征进行融合,从而更有可能得到最佳推理。xLJ拜客生活常识网


xLJ拜客生活常识网

对有效特征在BEV空间进行融合,一来数据损失少,二来算力消耗也较少(相对于前融合),所以一般在BEV空间进行中融合比较多。xLJ拜客生活常识网


xLJ拜客生活常识网

为了简化描述,如无特殊说明,下文提及的BEV感知,均指“BEV空间内的中融合”(特征级融合)。xLJ拜客生活常识网


xLJ拜客生活常识网

那么,视角转换到BEV空间,究竟有什么意义呢?xLJ拜客生活常识网


xLJ拜客生活常识网

想象一下停车就好了。停车挺有难度的,尤其对于新手司机来说。驾驶员不仅要注意前方,还要兼顾左右两个后视镜和车内倒车镜,根据经验去预估自车相对于周边障碍物的位置和距离。xLJ拜客生活常识网


xLJ拜客生活常识网

而有了车载360环视功能,驾驶员能从上帝视角一目了然地看到自车周边物体的位置和距离,停车也就变得简单了很多。xLJ拜客生活常识网


xLJ拜客生活常识网

xLJ拜客生活常识网

360度环视视角xLJ拜客生活常识网


xLJ拜客生活常识网

具体到智能驾驶系统,因为感知、预测、决策和规划等模块,都是在3D空间内进行的,而摄像头看到的图像信息,只是真实物理世界在透视视图(Perspective View)下的投影,从图像得到的信息,需要经过复杂的后处理才能使用,信息损失也很多。而将视觉信息转换到BEV空间,则可以很方便地连接感知与下游的 规划控制模块。xLJ拜客生活常识网


xLJ拜客生活常识网

此外,BEV空间内的感知任务,在精度上也有优势。做2D感知时,面对远处的物体,可能几个像素的误差便可能导致几十米的真实误差,而在BEV空间内训练模型时,对远处误差的损失(loss)更加明显,所以感知结果也会更准确一些。xLJ拜客生活常识网


xLJ拜客生活常识网

综上,这也就是BEV如此重要的原因。xLJ拜客生活常识网

相关阅读:

  • 三只松鼠就模特妆容道歉:基于个人特征打造没丑化
  • 肾炎的表现有哪些表现(肾炎有什么明显的特征)
  • 道德特征有哪些(道德行为的特征是指)
  • 偏头痛有哪些症状(偏头痛特征性症状)
  • 重组停牌多久(股票重组停牌前共同特征)
  • 汉堡为什么叫汉堡(汉堡包的特征描述)
  • 为什么喜欢女生的脚(喜欢女孩子脚的男生的特征)
  • 梅花是哪里的(梅花简介与特征)
  • 肛瘘是什么(肛瘘外口特征)
  • 唐氏综合症是什么(唐氏儿孕期明显特征)
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。