视觉大模型学习路径

本文只是从全局角度出发梳理学习过程,现阶段不会针对每一步写文章,工作没什么时间,但是会梳理自己的学习过程和一些好的参考文章。后面有时间再系统梳理每个模型

总览

 

本人目前主要研究基于transfermer的视觉大模型,同时也会学习开集的检测模型,因为这两个方向是迈向通用视觉大模型的基础。

基于transformer的视觉检测模型

transformer模型

我的前几篇文章写了相关代码可以参考文章,原理可以参考这几篇文章transformer1transformer2transformer3

vit模型

这个模型必须掌握,网上资料很多,我就罗列了

deter模型

这位大神的一系列文章

deformable模型

这位大神的一系列文章,当然还有b站的视频配合理解即可

后续继续添加

相关推荐

  1. 语言模型(LLM)学习路径和资料汇总

    2024-03-30 02:22:03       49 阅读
  2. AI语言模型工程师学习路线

    2024-03-30 02:22:03       37 阅读
  3. 学习路径】-AI数据学习路径整理-持续更新

    2024-03-30 02:22:03       40 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-30 02:22:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-30 02:22:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-30 02:22:03       82 阅读
  4. Python语言-面向对象

    2024-03-30 02:22:03       91 阅读

热门阅读

  1. leetcode 1035.不相交的线

    2024-03-30 02:22:03       40 阅读
  2. Linux 开发环境以及编译链接

    2024-03-30 02:22:03       37 阅读
  3. Transformer

    2024-03-30 02:22:03       40 阅读
  4. 爬虫第5课:POST请求

    2024-03-30 02:22:03       42 阅读
  5. 系统编程和网络编程

    2024-03-30 02:22:03       49 阅读
  6. LeetCode 54. 螺旋矩阵

    2024-03-30 02:22:03       39 阅读
  7. 论文复现3:Stable Diffusion v1

    2024-03-30 02:22:03       44 阅读
  8. 网络服务第三次作业

    2024-03-30 02:22:03       42 阅读
  9. fastjson2实现下划线与驼峰的自动映射

    2024-03-30 02:22:03       41 阅读
  10. 若干比赛题目以及补题复盘

    2024-03-30 02:22:03       37 阅读
  11. 十、Spring源码学习之onRefresh方法

    2024-03-30 02:22:03       35 阅读
  12. 学生管理系统——2

    2024-03-30 02:22:03       45 阅读