swift微调牧歌数据电商多模态大语言模型

大规模中文多模态评测基准MUGE_数据集-阿里云天池多模态理解和生成评估挑战榜(MUGE)是由阿里巴巴达摩院智能计算实验室发起,由阿里云天池平台承办,并由浙江大学、清华大学等单位共同协办。 Micon-default.png?t=N7T8https://tianchi.aliyun.com/dataset/107332微调的是牧歌数据集,结果都不好,记录一下。微调了qwenvl和llava,都是一样的类似结果,需要对数据做进一步的分析。通常在大语言模型中,存在PT和SFT中,一般来讲SFT的数据更重要的是数据质量,数据量多少并不是决定性因素,但是在VLM中的特征对齐和指令微调中,从llava中看,60w特征对齐,15w指令精调,也就是说你也可以当成PT和SFT两个阶段看,但是两者是完全不同的。

1.数据

用的是牧歌ECommerce-IC数据,本项任务涵盖

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-12 09:34:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-12 09:34:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-06-12 09:34:02       82 阅读
  4. Python语言-面向对象

    2024-06-12 09:34:02       91 阅读

热门阅读

  1. Solidity智能合约事件(event)

    2024-06-12 09:34:02       32 阅读
  2. 镜像没有包含 shell 导致无法进入容器

    2024-06-12 09:34:02       25 阅读
  3. openssl工具国际/国密签名命令行流程

    2024-06-12 09:34:02       27 阅读
  4. 互联网摸鱼日报(2024-06-11)

    2024-06-12 09:34:02       31 阅读
  5. 安装TensorFlow2.12.0

    2024-06-12 09:34:02       32 阅读
  6. Linux信号基础

    2024-06-12 09:34:02       26 阅读
  7. 介绍 TensorFlow 的基本概念和使用场景。

    2024-06-12 09:34:02       34 阅读
  8. 单例设计模式

    2024-06-12 09:34:02       30 阅读
  9. 计算机网络知识点(一)

    2024-06-12 09:34:02       27 阅读
  10. linux查找生产问题常用命令——参数解释

    2024-06-12 09:34:02       24 阅读