首页 > 网络 > 网络热点

一文读懂BEV空间内的特征级融合

常驻编辑 网络热点 2022-07-12 特征   真值   空间   传感器   模型   图像   视觉   目标   数据   信息

xLJ拜客生活常识网

4、BEV的发展历史xLJ拜客生活常识网


xLJ拜客生活常识网

在了解BEV的技术细节之前,我们先来了解下BEV的发展历史。xLJ拜客生活常识网


xLJ拜客生活常识网

传统方法的BEV空间转换方法,一般是先在图像空间对图像进行特征提取,生成分割结果,然后通过IPM(Inverse Perspective Mapping,逆透视变换)函数转换到BEV空间。xLJ拜客生活常识网

什么是IPM?xLJ拜客生活常识网


xLJ拜客生活常识网

在前视摄像头拍摄的图像中,由于透视效应现象(想象从一个点去看世界,透视效应会呈现出近大远小的观察结果)的存在,本来平行的事物(比如车道线),在图像中却不平行。IPM就是利用相机成像过程中的坐标系转化关系,对其原理进行抽象和简化,得到真实世界坐标系和图像坐标系之间坐标的对应关系,并进行公式化描述,从而消除这种透视效应,所以叫做逆透视变换。xLJ拜客生活常识网


xLJ拜客生活常识网

xLJ拜客生活常识网

车道线的逆透视变换(IPM)xLJ拜客生活常识网


xLJ拜客生活常识网

IPM是一种连接图像空间和BEV空间的简单直接的方法,只需要知道相机内外参数就可以。相机内参数,指的是与相机自身特性相关的参数,比如焦距、像素大小等,而相机外参数则是相机在真实世界坐标系中的参数,比如相机的安装位置、旋转方向等。xLJ拜客生活常识网


xLJ拜客生活常识网

不过,IPM依赖一些预先的假设,比如地面平直性假设(地面要是平的),且相机和地面之间没有相对运动(车辆的俯仰角不变)。xLJ拜客生活常识网


xLJ拜客生活常识网

很多时候这个假设太严苛了,很难满足,比如在颠簸道路上,或者在车辆加速或减速产生俯仰时,系统对目标物的感知结果波动非常大,会产生“忽近忽远”的跳变,平行的车道线,这时也会变成“内八”或者“外八”。xLJ拜客生活常识网


xLJ拜客生活常识网

于是就有了改进方案,那就是将相机的实时位姿考虑进来,加上俯仰角的修正补偿后,再进行空间转换。改进后虽然效果有所改善,但是实时位姿也很难准确得到,所以效果并不理想。xLJ拜客生活常识网


xLJ拜客生活常识网

这两年,深度学习也开始被应用于BEV空间转换,且逐渐成为主流方案。xLJ拜客生活常识网


xLJ拜客生活常识网

相比于依赖人为规则,使用神经网络从2D空间进行BEV空间转换,能够取得更好的感知效果。xLJ拜客生活常识网


xLJ拜客生活常识网

具体的流程是,先通过一个共享的主干网络(Backbone)来提取每个相机的特征(feature),然后再通过Transformer等将多摄像头数据,完成从图像空间到BEV空间的转换。在BEV空间内,由于坐标系相同,可以很方便地将图像数据和其他传感器数据(如Lidar、Radar等)进行融合,还可以进行时序融合形成4D空间,这也是当下BEV技术的大趋势。xLJ拜客生活常识网


xLJ拜客生活常识网

xLJ拜客生活常识网

毫末智行用于识别车道线的BEV时空融合感知网络xLJ拜客生活常识网


xLJ拜客生活常识网

5、BEV空间内中融合的优势xLJ拜客生活常识网


xLJ拜客生活常识网

相比于后融合和前融合,在BEV空间内进行中融合具有如下优势:xLJ拜客生活常识网


xLJ拜客生活常识网

1)跨摄像头融合和多模融合更易实现xLJ拜客生活常识网


xLJ拜客生活常识网

传统跨摄像头融合或者多模融合时,因数据空间不同,需要用很多后处理规则去关联不同传感器的感知结果,操作非常复杂。在BEV空间内做融合后,再做目标检测,算法实现更加简单,BEV空间内视觉感知到的物体大小和朝向也都能直接得到表达。

相关阅读:

  • 三只松鼠就模特妆容道歉:基于个人特征打造没丑化
  • 肾炎的表现有哪些表现(肾炎有什么明显的特征)
  • 道德特征有哪些(道德行为的特征是指)
  • 偏头痛有哪些症状(偏头痛特征性症状)
  • 重组停牌多久(股票重组停牌前共同特征)
  • 汉堡为什么叫汉堡(汉堡包的特征描述)
  • 为什么喜欢女生的脚(喜欢女孩子脚的男生的特征)
  • 梅花是哪里的(梅花简介与特征)
  • 肛瘘是什么(肛瘘外口特征)
  • 唐氏综合症是什么(唐氏儿孕期明显特征)
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。