LLM系列(2):开源LLM Promp调优之道进阶指南

LLM系列(2):开源LLM Promp调优之道进阶指南

随着大模型在不同领域场景的应用,AI 技术的落地方式也有了很大的颠覆,基于大模型的 AI 技术方案重构已成为当前热点和未来趋势。但另一方面,面向不同领域场景构建行业专属大模型,对底层计算资源要求比较高,通常需要大量的 GPU 卡完成行业专属大模型的训练。特别是当前一卡难求的现状,使得大模型在行业场景的落地面临较大的资源问题。如何基于有限的计算资源,在现有预训练大模型的基础上,开展行业场景的大模型落地,则显得更加符合迫切。本篇通过对 LLM 预训练大模型的 Prompt 调优方法的调研,梳理主要的 Prompt 调优方法,并在此基础上开展大模型行业场景的 PEFT 调优实践,评估不同规模参数的预训练大模型在具体场景调优过程中需要的资源需求,建立资源基线,以更好地在不同政企场景中开展大模型落地。本文整体结构如下:首先基于刘鹏飞的综述论文,对大模型调优方法进行整体说明,其次介绍下不同的 Prompt 调优方法,包括 hard prompt 和 soft prompt 的调优方法,最后对对应的调优方法开展落地实践,以建立大模型落地的资源基线。

1. Prompt 调优介绍

刘鹏飞的综述论文中,NLP 的发展历程总结为 4 种范式,如下图。在之前 “pre-train + finetune” 的范式基础上,发展出来一种 “pre-train, prompt, and pre

相关推荐

  1. LLM系列(2):开源LLM Promp指南

    2024-05-01 12:56:02       40 阅读
  2. SQL理论篇(一):数据库的

    2024-05-01 12:56:02       65 阅读
  3. JVM 指南

    2024-05-01 12:56:02       47 阅读
  4. JVM 21 的指南:如何进行JVM,JVM参数

    2024-05-01 12:56:02       59 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-05-01 12:56:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-05-01 12:56:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-05-01 12:56:02       87 阅读
  4. Python语言-面向对象

    2024-05-01 12:56:02       96 阅读

热门阅读

  1. typescript学习笔记

    2024-05-01 12:56:02       39 阅读
  2. html中引用视频文件的方式有哪些?

    2024-05-01 12:56:02       118 阅读
  3. 基于docker-compose使用虚拟机搭建redis集群

    2024-05-01 12:56:02       34 阅读
  4. GBCD:图卷积宽度跨域推荐系统

    2024-05-01 12:56:02       39 阅读
  5. C/C++中的逻辑运算与汇编指令的交互

    2024-05-01 12:56:02       107 阅读
  6. Kafka 2.13-3.7.0 在 Windows 上的安装与配置指南

    2024-05-01 12:56:02       90 阅读
  7. 深度学习避坑指南

    2024-05-01 12:56:02       36 阅读
  8. redis运维篇下篇

    2024-05-01 12:56:02       29 阅读
  9. Qt5配置Opencv读取一张图像

    2024-05-01 12:56:02       35 阅读
  10. 2024年第二十一届五一数学建模竞赛A题思路

    2024-05-01 12:56:02       30 阅读