YOLO蒸馏原理篇之---MGD、CWD蒸馏

一、MGD蒸馏

论文地址:https://arxiv.org/abs/2205.01529
论文翻译:https://mp.weixin.qq.com/s/FSvo3ns2maTpiTTWsE91kQ

1.1 摘要
知识蒸馏已成功应用于各种任务。当前的蒸馏算法通常通过模仿教师的输出来提高学生的表现。本文表明,教师还可以通过指导学生的特征恢复来提高学生的表征能力。从这个角度来看,我们提出了掩蔽生成蒸馏(MGD):通过屏蔽学生特征的随机像素,并迫使它通过一个简单的块来生成教师的完整特征。
MGD是一种真正通用的基于特征的蒸馏方法,可用于各种任务,包括图像分类、目标检测、语义分割和实例分割。

1.2 论文要点
1)引入了一种新的基于特征的知识蒸馏方法,它使学生通过其掩码特征生成教师的特征,而不是直接模仿。
2)提出了一种新的基于特征的蒸馏方法——掩蔽生成蒸馏,它简单且易于使用,仅有两个超参数。
3)通过对不同数据集的大量实验来验证该方法在各种模型上的有效性。对于图像分类和密集预测任务,学生使用 MGD 取得了显着的改进。

1.3 主要内容
基于特征的蒸馏可以应用于分类和密集预测。对特征蒸馏的基本方法可以表述为:
在这里插入图片描述
其中,FT和FS分别表示教师和学生的特征,falign是将学生的特征FS与教师的特征FT对齐的自适应层。C、H、W代表特征图的形状。
MGD总体框架流程:

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-01-09 11:10:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-09 11:10:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-09 11:10:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-09 11:10:03       20 阅读

热门阅读

  1. PG数据库更新表字段排序

    2024-01-09 11:10:03       35 阅读
  2. MySQL 8.0中新增的功能(七)

    2024-01-09 11:10:03       21 阅读
  3. git常用工具difftool的使用

    2024-01-09 11:10:03       30 阅读
  4. SQL-DML小结

    2024-01-09 11:10:03       36 阅读
  5. Bluez交叉编译

    2024-01-09 11:10:03       40 阅读
  6. C++ STL中vector的模拟实现

    2024-01-09 11:10:03       36 阅读
  7. 安卓adb

    2024-01-09 11:10:03       33 阅读
  8. 逐步递进地手写一个Promise

    2024-01-09 11:10:03       31 阅读
  9. 探索 GitHub:高效使用技巧与实例分享

    2024-01-09 11:10:03       40 阅读