阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B!

本文原文来自DataLearnerAI官方网站:
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B! | 数据学习者官方网站(Datalearner)icon-default.png?t=N7T8https://www.datalearner.com/blog/1051714140775766

 

Qwen1.5系列是阿里开源的一系列大语言模型,也是目前为止最强开源模型之一。Qwen1.5是Qwen2的beta版本,此前开源的模型最大参数规模都是720亿,和第一代模型一样。就在刚刚,阿里开源了1100亿参数规模的Qwen1.5-110B模型。评测结果显示MMLU略超Llama3-70B和Mixtral-8×22B。DataLearnerAI实测结果,相比Qwen1.5-72B模型来说,Qwen1.5-110B模型复杂任务的逻辑提升比较明显!

Qwen1.5-110B模型简介

在开源大模型领域,最大的模型参数规模通常不会超过700亿参数规模。最近2个月,国外开源的DBRX、Mixtral-8×22B-MoE是最新的超过1000亿参数规模的模型。而国内此前开源领域最大的参数模型是720亿参数规模的Qwen1.5-72B规模和650亿参数的深圳元象科技开源的XVERSE-65B。

这次阿里开源的1100亿参数规模的Qwen1.5-110B模型是截止目前为止国内开源模型中参数规模最大的模型。Qwen1.5-110B模型与其它Qwen1.5系列模型架构一致。采用了分组查询注意力机制,因此推理效率很高。该模型最高支持32K上下文,并且支持多语言,包括英文、中文、法语、西班牙语、德语、俄语、韩语、日文等。

按照1100亿参数估计,Qwen1.5-110B模型半精度的推理显存需要220GB

Qwen1.5-110B模型开源的版本包含基座模型和Chat优化版本,可以说诚意满满!

Qwen1.5-110B模型的评测结果

根据官方公布的评测结果,Qwen1.5-110B模型的评测结果略略超过Llama-3-70B和Mixtral-8×22B。也比Qwen1.5-72B模型本身更强。在DataLearnerAI收集的全球大模型排行榜中,Qwen1.5-110B模型的评测结果非常靠前:

数据来源:大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner)

这是按照MMLU排序的结果,也是除了Llama3-70B-Instruct模型外最强的开源模型。

Qwen1.5-110B模型实测结果

官方在HF上放了演示链接,我们用一个实例测试了Qwen1.5-110B和Qwen1.5-72B,模型逻辑方面Qwen1.5-110B模型明显更好,答案非常准确:

模型的开源地址和演示地址可以参考DataLearnerAI的模型信息卡:
Qwen1.5-110B:Qwen1.5-110B(Qwen1.5-110B)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Qwen1.5-110B-Chat:Qwen1.5-110B-Chat(Qwen1.5-110B-Chat)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Qwen1.5-72B:Qwen1.5-72B-Chat(Qwen1.5-72B-Chat)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-27 20:54:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-27 20:54:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-27 20:54:03       82 阅读
  4. Python语言-面向对象

    2024-04-27 20:54:03       91 阅读

热门阅读

  1. 函数为什么要防抖

    2024-04-27 20:54:03       27 阅读
  2. c++中的__declspec(dllexport) 和 __declspec(dllimport)

    2024-04-27 20:54:03       126 阅读
  3. 笔记:oracle报错ORA-55941

    2024-04-27 20:54:03       35 阅读
  4. 小红书笔记的规则权重算法7个要点

    2024-04-27 20:54:03       30 阅读
  5. c++ shared_ptr和weak_ptr结合应用实验

    2024-04-27 20:54:03       35 阅读
  6. c/c++的关键字 inline 介绍

    2024-04-27 20:54:03       24 阅读
  7. 学习笔记-数据结构-树与二叉树(2024-4-22)

    2024-04-27 20:54:03       75 阅读
  8. 【spring6】Spring IoC注解式开发

    2024-04-27 20:54:03       159 阅读
  9. Spring

    Spring

    2024-04-27 20:54:03      23 阅读
  10. CSS体验

    CSS体验

    2024-04-27 20:54:03      28 阅读
  11. 手写一个民用Tomcat (07)

    2024-04-27 20:54:03       30 阅读