LLM推理参数（top_k，top_p, temperature, num_beams）

2024-04-06 17:02:01
开发
40

正常LLM做 next token predicate 时，对输出的 logits 做 softmax，选择概率最大的token。

在这里插入图片描述

num_beams ：当我们设置 num_beams=2 后，就使用了 beam search 的方法，每次不是只直接选择概率最大的 token，而是保留 num_beams 个概率最大的 token 选择，接着进行下一轮的 next token predicate，把两次预测的 token的联合概率作为选择标准，选取联合概率最大的分支。
top_k：当我们设置top_k=2之后，会对LLM输出的 logits 保留 top_k 个最大的，然后其他 token 的 logits 设置为负无穷-inf，再对所有 logits 进行 softmax，那么-inf就会变成0，选概率最大的token即可。实现了在top_k个概率最大的 token 中选取。
top_p：当我们设置top_p=0.8之后，对每个token的softmax的概率累积求和，当概率达到top_p之后，后面概率更小的token概率设置为-inf，然后再经过一次softmax重新分配概率，取概率最大的token。
temperature：当我们设置temperature=[0,2]之后，就是对softmax进行调节。temperature越大，softmax得到的各个token概率越平均，生成的随机性越大。

在这里插入图片描述

原文地址:https://blog.csdn.net/weixin_54338498/article/details/137419996 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1776535822204538880.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

LLM推理参数（top_k，top_p, temperature, num_beams）

2024-04-06 17:02:01 41 阅读
LLMs推理框架总结

2024-04-06 17:02:01 66 阅读
LLM推理优化

2024-04-06 17:02:01 34 阅读
LLM - 模型参数设置

2024-04-06 17:02:01 39 阅读
LLM推理及加速知识

2024-04-06 17:02:01 36 阅读
大模型（LLM）的推理加速

2024-04-06 17:02:01 31 阅读
LLM的7种推理框架

2024-04-06 17:02:01 26 阅读
如何进行LLM大模型推理优化

2024-04-06 17:02:01 28 阅读
LLM推理需要占用多少显存

2024-04-06 17:02:01 20 阅读
大语言模型推理参数

2024-04-06 17:02:01 23 阅读

最近更新

题解 - 序列

2024-04-06 17:02:01 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-06 17:02:01 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-06 17:02:01 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-06 17:02:01 101 阅读
NoSQL之Redis非关系型数据库

2024-04-06 17:02:01 101 阅读
2024.7.22 作业

2024-04-06 17:02:01 98 阅读
GDB调试正在运行的程序

2024-04-06 17:02:01 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-06 17:02:01 85 阅读
在Django里面运行非项目文件

2024-04-06 17:02:01 82 阅读
SSD基本架构与工作原理

2024-04-06 17:02:01 87 阅读
在誉天学习完HCIE就业吗？

2024-04-06 17:02:01 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-06 17:02:01 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-06 17:02:01 86 阅读
go 协程池的实现

2024-04-06 17:02:01 89 阅读
Shell脚本循环语句与函数

2024-04-06 17:02:01 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-06 17:02:01 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-06 17:02:01 85 阅读
四大引用——强软弱虚

2024-04-06 17:02:01 87 阅读
Python语言-面向对象

2024-04-06 17:02:01 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-06 17:02:01 85 阅读
网站安全-CDN篇

2024-04-06 17:02:01 89 阅读

热门阅读

PDF格式解析：stream中图形状态保存指令q

2024-04-06 17:02:01 37 阅读
电脑硬件 - CPU散热器篇

2024-04-06 17:02:01 36 阅读
基于Springboot的超市信息管理系

2024-04-06 17:02:01 35 阅读
多目标优化算法 | 基于NSGAII实现软件项目研发周期和研发成本多目标技能员工调度优化模型求解附matlab代码

2024-04-06 17:02:01 40 阅读
LVM（逻辑卷管理器）

2024-04-06 17:02:01 51 阅读
基于Python近红外光谱分析与机器学、深度学习方法融合技术应用

2024-04-06 17:02:01 40 阅读
Memcached 教程之 PHP 连接 Memcached 服务(十)

2024-04-06 17:02:01 40 阅读
有关栈的算法

2024-04-06 17:02:01 36 阅读
环形链表2--绝妙的运算

2024-04-06 17:02:01 37 阅读
【HTML】CSS样式（二）

2024-04-06 17:02:01 39 阅读
【c++小课堂】sort排序

2024-04-06 17:02:01 42 阅读
用虚拟机安装gnu radio

2024-04-06 17:02:01 35 阅读
看书学习各类编程效率高吗？

2024-04-06 17:02:01 34 阅读
清明作业 c++

2024-04-06 17:02:01 56 阅读
【数据结构】时间和空间复杂度

2024-04-06 17:02:01 41 阅读
【Docker系列】在 Linux 上安装 Docker Compose 的简明步骤

2024-04-06 17:02:01 39 阅读
考研总计划篇

2024-04-06 17:02:01 41 阅读
10.图像高斯滤波的原理与FPGA实现思路

2024-04-06 17:02:01 40 阅读
C++类基础11——运算符重载

2024-04-06 17:02:01 36 阅读
AI Agents产品图谱+网站合集

2024-04-06 17:02:01 44 阅读
matlab中角度-弧度转化

2024-04-06 17:02:01 35 阅读
tomcat处理Http请求流程的步骤

2024-04-06 17:02:01 44 阅读
Promise-以往的异步编程模式

2024-04-06 17:02:01 37 阅读
代码随想录｜Day33｜动态规划02｜62.不同路径、63.不同路径II

2024-04-06 17:02:01 36 阅读
(文章复现)基于断线解环思想的配电网辐射状拓扑约束建模方法

2024-04-06 17:02:01 38 阅读
Acwing.504 转圈游戏(带取余的快速幂)

2024-04-06 17:02:01 30 阅读
基于单片机多功能数字钟系统仿真设计

2024-04-06 17:02:01 49 阅读
用C/C++加Easyx实现俄罗斯方块游戏（爆肝4万字，完全免费）

2024-04-06 17:02:01 34 阅读
“无货源小店”泛滥，消费者被坑惨了！电商将面临的集体破产！

2024-04-06 17:02:01 38 阅读
【一】Mac 本地部署大模型

2024-04-06 17:02:01 35 阅读