Rethinking overlooked aspects in vision-language models

2024-06-10 03:42:03
开发
8

探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub！https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction

多模态模型架构上的变化不大，数据的差距比较大，输入分辨率和输入llm的视觉token大小是比较关键的，适配器，VIT和语言模型则不是那么关键。InternVL-1.5，Qwen-VL-Max和DeepSeek-VL利用了Laion-5B和COYO这样的大规模预训练数据，数据量达到10亿，InternVL-1.5将sft划分为11个子类，并为每个子类收集相应的开源数据，对于预训练数据，LLM存在一个scaling law，但是在LVM中尚未发现。LLaVA在60多万数据上预训练，15w数据上sft效果就很好了。

原文地址:https://blog.csdn.net/u012193416/article/details/139481480 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1799889714375954432.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

热门阅读

NLP基础——序列模型（动手学深度学习）

2024-06-10 03:42:03 10 阅读
【教程】从0开始搭建大语言模型：文本预处理

2024-06-10 03:42:03 10 阅读
Chroium 源码目录结构分析（1）：源码目录体积一栏

2024-06-10 03:42:03 12 阅读
虚拟机Ubuntu扩展磁盘大小

2024-06-10 03:42:03 7 阅读
MySQL无法设置密码解决方案

2024-06-10 03:42:03 9 阅读
【TypeScript 从零实现 axios】2.1 TypeScript 常用语法-基础类型

2024-06-10 03:42:03 8 阅读
web前端构建表单：深入探索与实践

2024-06-10 03:42:03 11 阅读
Django Forbidden (CSRF cookie not set.)解决办法

2024-06-10 03:42:03 10 阅读
csdn上传图片失败解决办法

2024-06-10 03:42:03 11 阅读
OpenCV绘制直线

2024-06-10 03:42:03 9 阅读
Go语言整型(整数类型)的详解

2024-06-10 03:42:03 10 阅读
Unity VR 零基础开发之 Pico4 MR

2024-06-10 03:42:03 11 阅读
digit 手写数据库笔记 (机械学习)

2024-06-10 03:42:03 8 阅读
Spark安装、解压、配置环境变量、WordCount

2024-06-10 03:42:03 10 阅读
【BUG】已解决：Could not find a version that satisfies the requirement tensorflow

2024-06-10 03:42:03 9 阅读
SpringBoot——整合WebSocket长连接

2024-06-10 03:42:03 7 阅读
18 - 各赛事的用户注册率（高频 SQL 50 题基础版)

2024-06-10 03:42:03 11 阅读
Camx架构-Camera kernel Driver & debugging

2024-06-10 03:42:03 7 阅读
OpenCV的小部件最基本范例

2024-06-10 03:42:03 6 阅读
C++中的封装，继承和多态

2024-06-10 03:42:03 7 阅读
【设计模式】简单工厂模式

2024-06-10 03:42:03 11 阅读
C++中的常见I/O方式

2024-06-10 03:42:03 7 阅读
自动化专业之半导体行业入门指南

2024-06-10 03:42:03 9 阅读
【C51】DIY电子音乐贺卡：C51单片机项目设计与实现

2024-06-10 03:42:03 7 阅读
flowable 工作流从入门到精通

2024-06-10 03:42:03 9 阅读
MathType7.8永久破解版下载让数学学习变得简单有趣！

2024-06-10 03:42:03 9 阅读
Vulnhub-DC-3

2024-06-10 03:42:03 11 阅读
图解 Python 编程（12） | 文件和编码方式

2024-06-10 03:42:03 7 阅读
31｜HTTP3：甩掉TCP、TLS 的包袱，构建高效网络

2024-06-10 03:42:03 9 阅读
UML实现图-部署图

2024-06-10 03:42:03 9 阅读