(arxiv2401) CrossMAE


作者团队来自加州大学伯克利分校(UC Berkeley)和加州大学旧金山分校(UCSF)。论文主要探讨了在MAE的解码中,图像patch之间的依赖性,并提出了一种新的预训练框架 CrossMAE。
论文的主要贡献包括:

  • 提出了CrossMAE框架,其解码器仅利用掩码和可见标记之间的交叉注意力,而不使用掩码标记之间的自注意力。这种设计在不降低下游性能的情况下,提高了效率。
  • CrossMAE的设计允许仅解码一小部分掩码标记,这提高了预训练的效率。此外,每个解码器块现在可以利用不同的编码器特征,从而改善了表示学习。

贡献1:CrossMAE与MAE的对比如下图所示。MAE在decoder重建时,将 unmask 的 token恢复到图像中,整体进行self-attention计算,作者认为 masked token 彼此间也进行了attention计算,是没有必要的。所以,作者进行了改进,在解码器中将masked token 做为Q,unmasked token做为KV,进行cross attention计算。

在这里插入图片描述

贡献2: partial masking。作者只是随机挑选了一些 masked tokens 进行修复,这样会降低计算量,后面有实验分析。此外,作者还有一处改进,在编码器的各个 transformer block 之间动态学习了一个权重,对特征加权。这就有些像 layer attention。不过,这个改进并没有刻意的在引言里强调。

在这里插入图片描述
CrossMAE 比 MAE 提高了0.3%,而且只重建25%的token效果就已经非常好了,计算效率显著提升。

在这里插入图片描述

相关推荐

  1. arxiv】国内arxiv 镜像

    2024-04-06 08:30:03       30 阅读
  2. 2401vim,vim标号

    2024-04-06 08:30:03       43 阅读
  3. 2401llvm,clang转换器

    2024-04-06 08:30:03       48 阅读
  4. HDOJ 2041

    2024-04-06 08:30:03       46 阅读
  5. 2401编辑器,好插件

    2024-04-06 08:30:03       71 阅读
  6. 2401C++,C++自动注册

    2024-04-06 08:30:03       62 阅读
  7. 2401llvm,clang的libtooling

    2024-04-06 08:30:03       65 阅读
  8. 2401llvm,clang插件

    2024-04-06 08:30:03       55 阅读
  9. 2401cmake,学习cmake1

    2024-04-06 08:30:03       60 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-06 08:30:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-06 08:30:03       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-06 08:30:03       82 阅读
  4. Python语言-面向对象

    2024-04-06 08:30:03       91 阅读

热门阅读

  1. CSS简单给表格加上细边框

    2024-04-06 08:30:03       32 阅读
  2. JJJ:网络子系统的软中断

    2024-04-06 08:30:03       28 阅读
  3. [官网解读]Spark Shuffle

    2024-04-06 08:30:03       31 阅读
  4. 【算法】初识算法

    2024-04-06 08:30:03       33 阅读
  5. 可视化规则编排Drools WorkBench部署和基础介绍

    2024-04-06 08:30:03       37 阅读
  6. RobotFramework测试框架(11)--变量文件

    2024-04-06 08:30:03       39 阅读
  7. 怎么理解React refs,在哪些场景下使用?

    2024-04-06 08:30:03       37 阅读
  8. 03---webpack进阶用法

    2024-04-06 08:30:03       31 阅读
  9. C语言中不常用到的一些函数

    2024-04-06 08:30:03       38 阅读
  10. html的简单使用

    2024-04-06 08:30:03       37 阅读