BEVDet是基于LSS的自底向上建立BEV的方法,今天要读的BEVdet4D这篇论文,把BEVDet的3D研究范式提升到时空4D空间中。
首先咱们简要回顾一下BEVDet框架。
如上图所示,BEVDet由四个模块组成:
1)Image-view Encoder,包括一个主干和一个颈部,用于环视图像特征提取。
主干模型选择:ResNet,SwinTransformer,DenseNet,HRNet
颈部模型选择:FPN、FPN-LSS
2)View Transformer,利用了LSS中的深度估计算法,将图像特征映射到BEV坐标。
把基于图像视图的特征当做输入,先对图像进行升维构造视锥,预测图像的深度。然后基于预测的图像深度和图像特征生成点云,最后在竖直方向上pooling得到BEV特征。
3)BEV Encoder,类似第一步图像视图编码Image-
相关文章
发表评论