DN-DETR的原理和源码解读

在decoder中:
query就是代表tgt信息,
于是用gt+noise生成几个known_query,known_query无需匈牙利直接和gt匹配.使得模型可以去噪.

一些骚操作:
1.box偏移不能太过,否在假如跑到别的gt上去了,那就说不通了.
解决方法:box的xy偏移小于wh的一半就好啦
2.decoder的自注意力,ori_query如果提取到known_query信息等于给了gt的先验,不利于模型学习.
known_query如果跨组提取了对应的box信息也等于给了gt的先验,不利于噪声学习.因次设置att_mask,防止以上两种干扰.
3:每一张图的gt数量不一致,那么cat(query,known_query)数量不一致,无法batch训练.
解决方法:老一套,少的图补零.

心得体会:
拿知识蒸馏来对比,最后一层的known_query先当于teacher生成的soft_label,两个loss共同指导模型收敛.

源码解读:
假设batch为2,
b_id=0 gt=[l0,dim],
b_id=1 gt=[l1,dim],
合并gt_all=[l0+l1,dim]
对dim维度信息进行适当的offset,就是noise
拆分batch,合并ori_query_pos=[l_ori,dim]
考虑目标最多的图的目标数量lmax
最后的query_pos=[b,lmax+l_ori,dim],为什么不搞个mask标记补充的000
att_mask用于上述的骚操作2

相关推荐

  1. DN-DETR原理解读

    2024-05-01 00:48:01       13 阅读
  2. DNS背景工作原理作用

    2024-05-01 00:48:01       14 阅读
  3. vue3 解析之Reactive实现原理

    2024-05-01 00:48:01       30 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-05-01 00:48:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-01 00:48:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-01 00:48:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-01 00:48:01       20 阅读

热门阅读

  1. Golang中的Json标签(持续更新...)

    2024-05-01 00:48:01       11 阅读
  2. 重要数据的识别因素

    2024-05-01 00:48:01       12 阅读
  3. 人工智能入门:你需要掌握哪些基础知识?

    2024-05-01 00:48:01       11 阅读
  4. 【设计模式】14、strategy 策略模式

    2024-05-01 00:48:01       11 阅读
  5. 你用过最好用的AI工具有哪些?【模板】

    2024-05-01 00:48:01       11 阅读
  6. 如何在React中实现状态钩子

    2024-05-01 00:48:01       13 阅读
  7. 剧情游戏如何制作?

    2024-05-01 00:48:01       8 阅读
  8. 跟我学C++中级篇——内联

    2024-05-01 00:48:01       11 阅读
  9. pytest.ini配置文件

    2024-05-01 00:48:01       13 阅读