大模型生成的常见Top-k、Top-p、Temperature参数

参考:
https://zhuanlan.zhihu.com/p/669661536

在这里插入图片描述

topK,topP

https://www.douyin.com/video/7380126984573127945

主要是softmax产生的词表每个词的概率分布后,
topK,比如K=3,表示采样概率最大的前3个,其他全部舍弃,在这前3个词选择
topP,P比如P=0.7,表示采样前面概率最大的加和>=0.7的所有词,后续在这些词中进行再选择,其他舍弃

综合下来:topP一般给后续选择的空间比topK要多些

Temperature

https://www.douyin.com/video/7380324563369889061

主要是在改变 softmax 生成解码token的概率上(所有词表每个词的可能概率):
正常softmax
在这里插入图片描述

加速Temperature后的softmax
每个指数除以t;e是自然是约等于2.7
在这里插入图片描述

T大于1,越大 softmax生成的每个词的概率差别不大,所以更随机
T小于1,越小 softmax生成的每个词的概率差别大,所以更确认,就是少部分几个词的概率最大
在这里插入图片描述

相关推荐

  1. 启动模型训练常见docker参数

    2024-06-17 02:32:04       15 阅读
  2. 提示工程 1—常用语言模型参数说明

    2024-06-17 02:32:04       13 阅读
  3. 常见模型框架

    2024-06-17 02:32:04       11 阅读
  4. 模型模型参数为什么这么多

    2024-06-17 02:32:04       19 阅读
  5. 模型模型参数

    2024-06-17 02:32:04       25 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-17 02:32:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-17 02:32:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-17 02:32:04       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-17 02:32:04       20 阅读

热门阅读

  1. MySql 数据库、表常用语句

    2024-06-17 02:32:04       5 阅读
  2. Linux 常用命令

    2024-06-17 02:32:04       5 阅读
  3. 简单的线程池示例

    2024-06-17 02:32:04       8 阅读
  4. 破解视频会员(你我都懂)

    2024-06-17 02:32:04       8 阅读
  5. leetcode122-Best Time to Buy and Sell Stock II

    2024-06-17 02:32:04       8 阅读
  6. Github 2024-06-11Python开源项目日报 Top10

    2024-06-17 02:32:04       8 阅读
  7. 某文旅集团定岗定编项目成功案例纪实

    2024-06-17 02:32:04       7 阅读