YoloV8改进策略:基于频域多轴表示学习模块|全网首发|高效涨点|代码注释详解

摘要

涨点效果:在我自己的数据集上,改进一的mAP50 由0.986涨到了0.99,mAP50-95由0.737涨到0.749,涨点明显!
本文尝试使用频域多轴表示学习模块改进YoloV8,尝试了三种改进方式,均有不同的涨点。

论文:《医学图像分割中的频域多轴表示学习》

https://arxiv.org/pdf/2312.17030v1.pdf
最近,视觉Transformer (ViT)在医学图像分割(MIS)中得到了广泛应用,这归功于其在空间域应用自注意力机制来建模全局知识。然而,许多研究都侧重于改进空间域模型,而忽略了频率域信息的重要性。因此,我们提出了基于U-shape架构的多轴外部权重UNet(MEW-UNet),通过将ViT中的自注意力替换为我们的多轴外部权重块。具体来说,我们的块对输入特征的三个轴进行傅里叶变换,并在频率域中分配由我们的外部权重生成器生成的外部权重。然后,进行逆傅里叶变换以将特征变回空间域。我们在Synapse、ACDC、ISIC17和ISIC18数据集上评估了我们的模型,由于其有效地利用了频率域信息,我们的方法表现出了竞争力。
代码:https://github.com/jcruan519/mew-unet

关键词:医学图像分割、注意力机制、频率域信息

1 简介

医学图像分割(MIS)具有巨大的实用价值,因为它可以帮助相关医务人员定位病变区域,提高临床治疗的效率。近年来,基于U-shape架构的编码器-解码器模型

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-01-06 22:32:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-06 22:32:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-06 22:32:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-06 22:32:01       20 阅读

热门阅读

  1. C#-数组

    2024-01-06 22:32:01       40 阅读
  2. ffmpeg 改变帧率,分辨率,时长等命令

    2024-01-06 22:32:01       41 阅读
  3. 双步进电机综合控制

    2024-01-06 22:32:01       32 阅读
  4. 【100条sqlite3常用命令】

    2024-01-06 22:32:01       36 阅读
  5. Core Web Vitals

    2024-01-06 22:32:01       34 阅读
  6. 生成式AI:革新软件开发流程与工具的未来趋势

    2024-01-06 22:32:01       39 阅读
  7. Python基础语法笔记 tkinter的简单使用

    2024-01-06 22:32:01       41 阅读
  8. 关于Django静态文件路径设置规则的精炼总结

    2024-01-06 22:32:01       52 阅读
  9. 前端cdn、ajax、code等加速

    2024-01-06 22:32:01       46 阅读
  10. vi和vim的使用

    2024-01-06 22:32:01       40 阅读