FasterNet 与 RT-DTER 的 碰撞,打造 Faster-DTER 目标检测网络 | 《Run, Don’t Walk: Chasing Higher FLOPS for Faster 》

本专栏内容均为博主独家全网首发,未经授权,任何形式的复制、转载、洗稿或传播行为均属违法侵权行为,一经发现将采取法律手段维护合法权益。我们对所有未经授权传播行为保留追究责任的权利。请尊重原创,支持创作者的努力,共同维护网络知识产权。


在这里插入图片描述

论文地址:https://export.arxiv.org/pdf/2303.03667v1.pdf


为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。并且,如此低的FLOPS主要是由于运算符的频繁内存访问,尤其是深度卷积。因此,本文提出了一种新的partial convolution(PConv),通过同时减少冗余计算和内存访问可以更有效地提取空间特征。基于PConv进一步提出FasterNet,在广泛的设备上实现了比其他网络高得多的运行速度,而不影响各种视觉任务的准确性。同时,实现了令人印象深刻的83.5%的TOP-1精度,与Swin-B不相上下,同时GPU上的推理吞吐量提高了49%,CPU上的计算时间也节省了42%。


原理解析

相关推荐

  1. DETR 目标检测

    2023-12-05 23:46:01       50 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-05 23:46:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-05 23:46:01       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-05 23:46:01       87 阅读
  4. Python语言-面向对象

    2023-12-05 23:46:01       96 阅读

热门阅读

  1. React Hooks(实例及详解)

    2023-12-05 23:46:01       39 阅读
  2. ARM MCU SWD离线调试器

    2023-12-05 23:46:01       45 阅读
  3. .sketch的文件转.psd文件

    2023-12-05 23:46:01       55 阅读
  4. 【无标题】

    2023-12-05 23:46:01       69 阅读
  5. 代码解读:Zero-shot 视频生成任务 Text2Video-Zero

    2023-12-05 23:46:01       68 阅读
  6. 解读文生视频大模型ModelScopeT2V技术报告

    2023-12-05 23:46:01       68 阅读
  7. 【音频】Glitch、降噪相关

    2023-12-05 23:46:01       54 阅读
  8. 如何使用Go与MQTT进行通信

    2023-12-05 23:46:01       39 阅读
  9. C语言初学4:C 存储类

    2023-12-05 23:46:01       63 阅读
  10. 如何拆解Unity 2022.3版本的AssetBundle

    2023-12-05 23:46:01       73 阅读
  11. Mybatis-plus逻辑删除

    2023-12-05 23:46:01       54 阅读