国内外大模型 SuperCLUE 基准测试

本心、输入输出、结果

国内外大模型 SuperCLUE 基准测试


编辑 | 简简单单 Online zuozuo
地址 | https://blog.csdn.net/qq_15071263


如果觉得本文对你有帮助,欢迎点赞、收藏、评论

前言

国内外大模型 SuperCLUE 基准测试

1

国内外大模型 SuperCLUE 基准测试榜单

中文大模型测评基准 SuperCLUE 发布 2024 上半年报告,披露针对国内外 33 个大模型的综合测评结果

在这里插入图片描述

从代表通用能力的一级总分来看,OpenAI 的 GPT-4o 以 81 分高居榜首,Claude-3.5-Sonnet 与通义千问开源模型 Qwen2-72B-Instruct 并列第二,得分均为 77。

通义千问 (Qwen2-72B) 既是排名最高的中国大模型,也是全球最强的开源大模型,性能超越文心一言 4.0、讯飞星火 V4.0、Llama-3-7

相关推荐

  1. 国内外模型最全合集

    2024-07-14 01:48:01       135 阅读
  2. LLM的测试工具:LaVague平替成国内模型

    2024-07-14 01:48:01       32 阅读
  3. 国内模型五虎

    2024-07-14 01:48:01       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 01:48:01       70 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 01:48:01       74 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 01:48:01       62 阅读
  4. Python语言-面向对象

    2024-07-14 01:48:01       72 阅读

热门阅读

  1. Go语言map并发安全,互斥锁和读写锁谁更优?

    2024-07-14 01:48:01       23 阅读
  2. 调用 create_meshgrid 函数时出现了 TypeError

    2024-07-14 01:48:01       18 阅读
  3. 学院教学信息管理系统(c++)

    2024-07-14 01:48:01       17 阅读
  4. 元组-预习

    2024-07-14 01:48:01       18 阅读
  5. Python标准库中的HTTP客户端模块

    2024-07-14 01:48:01       22 阅读
  6. HTTPS的工作原理(HTTPS建立连接的过程)

    2024-07-14 01:48:01       20 阅读
  7. 记录一点mybatis的坑

    2024-07-14 01:48:01       19 阅读
  8. 5Python的Pandas:数据结构

    2024-07-14 01:48:01       17 阅读
  9. 【技术支持】npm镜像设置

    2024-07-14 01:48:01       19 阅读
  10. 2024.7.31 Spyglass dft tcl 及sgdc使用总结

    2024-07-14 01:48:01       20 阅读
  11. Qt- 槽函数和普通函数的主要区别

    2024-07-14 01:48:01       20 阅读