06浅谈大语言模型可调节参数TopP和TopK

浅谈大模型参数TopP和TopK

大语言模型中的temperaturetop_ptop_k参数是用来控制模型生成文本时的随机性和创造性的。下面分享一下topPtopK两个参数的意义及逻辑;

top K(Top-K Sampling)

  • 作用:只从模型认为最可能的k个词中选择下一个词。k值越大,选择范围越广,生成的文本越多样;k值越小,选择范围越窄,生成的文本越趋向于高概率的词。

  • 常见设置:一般设置在40到100之间。较小的k值可以提高文本的相关性和连贯性,而较大的k值则增加了文本的多样性。

top P(Nucleus Sampling)

  • 作用:从概率累计达到p的那一组词中随机选择下一个词。与Top-K不同,Top-P是动态的,依据每个上下文的不同而变化。

  • 常见设置:通常设置在0.8到0.95之间。较低的top_p值(如0.8)使生成的文本更加可预测和相关,而较高的值(如0.95)增加了文本的多样性和创造性。

top K VS top P

  • top_k提供了一个固定数量的候选词,而top_p提供了一个动态变化的候选词集合,其大小取决于特定上下文中词的概率分布。

  • 使用top_k可能会导致生成的文本在不同情况下过于类似,因为它总是从固定数目的最可能的词中选择。相比之下,top_p提供了更多的灵活性和多样性,因为它允许根据上下文的不同选择不同数量的候选词。

通俗理解top P和top K背后逻辑

在这里插入图片描述

相关推荐

  1. NLP模型的关系

    2024-07-10 23:04:02       47 阅读
  2. AI模型学习的理论基础发展

    2024-07-10 23:04:02       22 阅读
  3. RPC调用

    2024-07-10 23:04:02       43 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 23:04:02       5 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 23:04:02       5 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 23:04:02       4 阅读
  4. Python语言-面向对象

    2024-07-10 23:04:02       8 阅读

热门阅读

  1. 生物环保的技术原理和优点是什么

    2024-07-10 23:04:02       11 阅读
  2. 深入理解Spring Cloud中的服务注册

    2024-07-10 23:04:02       9 阅读
  3. SIFT代码,MATLAB

    2024-07-10 23:04:02       9 阅读
  4. Scala 数据类型

    2024-07-10 23:04:02       11 阅读
  5. DP学习——简单工厂模式

    2024-07-10 23:04:02       9 阅读
  6. 从 Spark 离线数仓到 Flink 实时数仓:实战指南

    2024-07-10 23:04:02       9 阅读
  7. 浅析DDoS高防数据中心网络

    2024-07-10 23:04:02       10 阅读
  8. 奇幻的Python

    2024-07-10 23:04:02       10 阅读
  9. 记录一些简单的linux运维命令

    2024-07-10 23:04:02       9 阅读
  10. python--del

    2024-07-10 23:04:02       9 阅读