【BEV感知】BEVFormer 融合多视角相机空间特征和时序特征的端到端框架 ECCV 2022

前言

本文分享BEV感知方案中,具有代表性的方法:BEVFormer。

基本思想:使用可学习的查询Queries表示BEV特征查找图像中的空间特征先前BEV地图中的时间特征

它基于Deformable Attention实现了一种融合多视角相机空间特征时序特征端到端框架,适用于多种自动驾驶感知任务。

主要由3个关键模块组成:

  • BEV Queries Q:用于查询得到BEV特征图
  • Spatial Cross-Attention:用于融合多视角空间特征
  • Temporal Self-Attention:用于融合时序BEV特征

流程思路:采用3D到2D的方式,先在BEV空间初始化特征,通过在BEV高度维度“升维”形成3D特征。再通过映射关系,使用多层transformer与每个图像2D特征进行交互融合,最终再得到BEV特征。

论文地址:

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-18 08:30:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-18 08:30:01       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-18 08:30:01       87 阅读
  4. Python语言-面向对象

    2023-12-18 08:30:01       96 阅读

热门阅读

  1. t2017030921字母矩阵

    2023-12-18 08:30:01       54 阅读
  2. HTML选择题试题——附答案

    2023-12-18 08:30:01       60 阅读
  3. GB/T 19536-2015 集装箱底板用胶合板检测

    2023-12-18 08:30:01       49 阅读
  4. 记录一次 Linux/Android 读取大文件失败

    2023-12-18 08:30:01       69 阅读
  5. KMP算法

    2023-12-18 08:30:01       70 阅读
  6. SearchWP WooCommerce电商商城搜索集成

    2023-12-18 08:30:01       70 阅读