大模型学习之书生·浦语大模型6——基于OpenCompass大模型评测

2024-01-22 12:04:04
开发
34

在这里插入图片描述

基于OpenCompass大模型评测

关于评测的三个问题Why/What/How

在这里插入图片描述

Why

在这里插入图片描述

What

在这里插入图片描述

有许多任务评测，包括垂直领域

How

在这里插入图片描述

包含客观评测和主观评测，其中主观评测分人工和模型来评估。

提示词工程

在这里插入图片描述

主流评测框架

在这里插入图片描述

OpenCompass 能力框架

在这里插入图片描述

模型层
能力层
方法层
工具层

在这里插入图片描述
支持丰富的模型

在这里插入图片描述
评测流水线设计，能切分多个独立执行的任务，最大化利用计算资源。

大模型能力对比结果输出

前言探索
在这里插入图片描述

在这里插入图片描述

探索性方向涵盖：

多模态
法律
医生

挑战

在这里插入图片描述

实践

创建开发环境和准备数据集

在这里插入图片描述
查看支持的数据集：

启动评测

客观评测

主要是run.py代码文件
在这里插入图片描述

datasets：指定数据集
hf-path：模型文件
tokenizer-path：tokenizer路径
max-seq-len：模型读入的最大长度
max-out-len：模型输出的最大长度，客观题设置一般较小
–debug：debug模式，打印出所有的过程

主观评测

主要是eval_sbujective_alignbench.py文件修改，需要注意model，max_out_len等处的修改。
在这里插入图片描述

原文地址:https://blog.csdn.net/uncle_ll/article/details/135727570 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1749281752037330944.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

热门阅读

【100个 Unity实用技能】☀️ | Unity中过滤透明区域的点击事件

2024-01-22 12:04:04 37 阅读
【VRTK】【PICO】如何快速创建一个用VRTK开发的PICO项目

2024-01-22 12:04:04 33 阅读
frida https抓包

2024-01-22 12:04:04 28 阅读
Docker（九）Docker Buildx

2024-01-22 12:04:04 28 阅读
AI论文润色平台一览，让你的论文更加流畅易懂！

2024-01-22 12:04:04 36 阅读
认识Linux指令之 “ 重定向” 符号

2024-01-22 12:04:04 30 阅读
Sqoop数据导入到Hive表的最佳实践

2024-01-22 12:04:04 37 阅读
STM32WLE5JC学习

2024-01-22 12:04:04 31 阅读
Oracle Linux 6.10 安装图解

2024-01-22 12:04:04 41 阅读
ubuntu 安装protobuf

2024-01-22 12:04:04 36 阅读
如何有效开展网络安全事件调查工作

2024-01-22 12:04:04 29 阅读
C++大学教程（第九版）6.12停车费

2024-01-22 12:04:04 32 阅读
跟着pink老师前端入门教程-day08

2024-01-22 12:04:04 30 阅读
项目整合管理-8.1制定项目章程

2024-01-22 12:04:04 26 阅读
k8s 使用tomcat官方镜像部署集群并解决访问页面404

2024-01-22 12:04:04 36 阅读
C++编译和链接

2024-01-22 12:04:04 29 阅读
如何利用chatgpt写论文之论文选题

2024-01-22 12:04:04 24 阅读
vue2 路由守卫讲解。

2024-01-22 12:04:04 31 阅读
c++设计模式之单例模式

2024-01-22 12:04:04 28 阅读
无人机应用分析

2024-01-22 12:04:04 23 阅读
使用VSCode开发 Python虚拟环境配置说明

2024-01-22 12:04:04 28 阅读
linux开机自启动方法

2024-01-22 12:04:04 25 阅读
【Python】FastApi框架搭建部署

2024-01-22 12:04:04 32 阅读
暴力破解常见的服务器

2024-01-22 12:04:04 36 阅读
GraphicsMagick 的 OpenCL 开发记录（十一）

2024-01-22 12:04:04 31 阅读
C# 实现凯撒密码

2024-01-22 12:04:04 27 阅读
PIG框架学习3——Redisson 实现业务接口幂等

2024-01-22 12:04:04 37 阅读
【 CSS 】基础 2

2024-01-22 12:04:04 31 阅读
Web02--CSS基础

2024-01-22 12:04:04 27 阅读
MCU常用外设总线

2024-01-22 12:04:04 28 阅读