大语言模型推理参数

{
  "assistant_token_id": 196,
  "bos_token_id": 1,
  "do_sample": true,
  "eos_token_id": 2,
  "max_new_tokens": 2048,
  "pad_token_id": 0,
  "repetition_penalty": 1.05,
  "temperature": 0.3,
  "top_k": 5,
  "top_p": 0.85,
  "transformers_version": "4.32.1",
  "user_token_id": 195
}

1.Topk

只考虑概率最大的topk个token

2.Top p

从概率最高的token开始累计,直到累计的概率超过了top p。

3.Temperature

T越大越发散,T越小,越稳定,温度嘛,其实就是在softmax中增加了一个T,常见做法。

4.do_sample

true,模型在生成文本时使用采样方法,而不是直接选择概率最高的下一个token。

5.reptition penalty

防止重复

相关推荐

  1. 语言模型推理优化策略

    2024-07-10 01:22:05       49 阅读
  2. 无服务器推理语言模型中的未来

    2024-07-10 01:22:05       39 阅读
  3. 提示工程 1—常用的语言模型参数说明

    2024-07-10 01:22:05       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 01:22:05       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 01:22:05       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 01:22:05       45 阅读
  4. Python语言-面向对象

    2024-07-10 01:22:05       55 阅读

热门阅读

  1. #pragma 指令

    2024-07-10 01:22:05       23 阅读
  2. C++休眠的方法

    2024-07-10 01:22:05       23 阅读
  3. Spring容器加载Bean和JVM加载类

    2024-07-10 01:22:05       20 阅读
  4. word 使用手册

    2024-07-10 01:22:05       27 阅读
  5. winform4

    winform4

    2024-07-10 01:22:05      22 阅读
  6. PlugLink:小微企业自动化运营的魔法盒子

    2024-07-10 01:22:05       27 阅读
  7. Centos7删除MariaDB

    2024-07-10 01:22:05       22 阅读
  8. Docker多阶段构建Node.js应用程序

    2024-07-10 01:22:05       22 阅读
  9. 深入Django(八)

    2024-07-10 01:22:05       23 阅读