多模态学习实战手册:读懂CompassRank榜单的评测指标!

1. 前言

榜单链接:CompassRank

CompassRank 是一个中立且全面的性能榜单,作为大模型评测体系 OpenCompass2.0 中各类榜单的承载平台。它覆盖多领域、多任务下的模型性能,并定期更新,以提供动态的行业洞察。

CompassRank 保持中立性,不受任何商业利益干扰,并依托于 CompassKit 工具链体系中的各类评测手段,确保了其客观性。这个平台旨在帮助从业者理解技术深意,优化模型选择,并对大模型的技术创新提供坚实的技术支撑

编辑

2. 整体指标

  1. Method: 这列通常表示模型的名称和训练方法,包括模型架构、训练策略和可能的微调技术。
  2. Time: 在这个上下文中,时间可能指的是模型训练或推理的时间,但具体信息需要查看详细页面以获取准确数据。
  3. Params: 模型的参数数量,以百万(M)或十亿(B)为单位,表示模型的复杂度。
  4. Language Model: 语言大模型,如InternLM2、QwenLM等
  5. Vision Model: 视觉大模型如CLIP ViT-L/14、EVA-02-5B等
  6. Avg. Rank: 模型在所有列出的测试集上的平均排名,数值越小表示整体性能越好。
  7. Avg. Score: 模型在所有测试集上的平均得分,高分表示模型性能更优。

3. MMBench

  1. MMBench Test: MMBench测试集,一个多模态基准,用

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-04-06 20:04:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-06 20:04:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-06 20:04:02       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-06 20:04:02       20 阅读

热门阅读

  1. C++智能指针2——unique_ptr和weak_ptr

    2024-04-06 20:04:02       15 阅读
  2. 【leetcode面试经典150题】14.加油站(C++)

    2024-04-06 20:04:02       14 阅读
  3. Vue3实现图片懒加载

    2024-04-06 20:04:02       16 阅读
  4. leetcode删除有序数组中的重复项

    2024-04-06 20:04:02       15 阅读
  5. 【趣味学算法】13_素数

    2024-04-06 20:04:02       14 阅读
  6. 爬虫 知识点2以及SSL1129错误该怎么解决

    2024-04-06 20:04:02       13 阅读
  7. python项目练习——15.网页爬虫应用程序

    2024-04-06 20:04:02       15 阅读
  8. 开源充电桩设备监控系统技术解决方案

    2024-04-06 20:04:02       13 阅读
  9. 代码随想录Day45

    2024-04-06 20:04:02       13 阅读
  10. VOC2012数据集格式转化为YOLO格式

    2024-04-06 20:04:02       12 阅读