大语言模型：Large Language Models Are Human-Level Prompt Engineers概述

2024-03-16 00:32:01
开发
20

研究内容

如何通过prompt，在不进行微调大语言模型的前提下，增加大语言模型的表现

研究动机

prompt非常有用，但是人工设置的非常不自然；
因此提出了要自动使用大语言模型自己选择prompt；
取得了很好的效果。

作者主要是提出了三件事：

如何让大语言模型生成prompt

LLM是可以分为两类的，

其中一类GPT是只能从前到后的，他们不支持句子补全（在一段话当中填写空缺位置）；
另一类，则是可以反向的例如T5、GLM、 InsertGPT，这些模型就会支持句子补全。

因此作者为这两类模型分别设置了两种方法，例子如下：
在这里插入图片描述
同时作者指出，也不一定要和这俩完全相同，使用回答评价指标一定可以找到一个更加适合指令instruction生成的prompt这里只是样板(template)。作者给出了在本文实验当中实际采用的prompt：

如何评价这些prompt

就是简单的让其跑一下分

如何进一步优化prompt

可以使用大语言模型进一步resample跑一下选出来的高分指令instruction：

在这里插入图片描述
再在这些指令当做选择更好的指令。

原文地址:https://blog.csdn.net/qq_43210957/article/details/136626002 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1768676534916354048.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

LLM - 大语言模型(LLM) 概述

2024-03-16 00:32:01 20 阅读
LORA概述: 大语言模型的低阶适应

2024-03-16 00:32:01 35 阅读
大语言模型无代码构建知识图谱概述

2024-03-16 00:32:01 32 阅读
LLM - 大语言模型的预训练数据(Dataset) 概述

2024-03-16 00:32:01 24 阅读
LLM - 大语言模型的分布式训练概述

2024-03-16 00:32:01 21 阅读
大语言模型(LLM)Token 概念

2024-03-16 00:32:01 21 阅读
大语言模型RAG-技术概览 (一)

2024-03-16 00:32:01 22 阅读
大语言模型(LLM) 参数量概念

2024-03-16 00:32:01 19 阅读
ABeam Insight | 大语言模型系列 (1) : 大语言模型概览

2024-03-16 00:32:01 30 阅读
LLM - 大语言模型的自注意力(Self-Attention)机制基础概述

2024-03-16 00:32:01 14 阅读

热门阅读

使用 Docker Compose 快速搭建监控网站 uptime-kuma

2024-03-16 00:32:01 21 阅读
Solidity Uniswap V2 Router contract addLiquidity

2024-03-16 00:32:01 21 阅读
ZK vs FHE

2024-03-16 00:32:01 18 阅读
如何把在本地存储sessionStorage.setItem()上存的值渲染在输入框中js

2024-03-16 00:32:01 21 阅读
浏览器插件开发初体验(URL OPENER)

2024-03-16 00:32:01 23 阅读
在OpenStack架构中，Controller节点的配置（基础）

2024-03-16 00:32:01 24 阅读
掘根宝典之C++迭代器简介

2024-03-16 00:32:01 19 阅读
嵌入式面经-ARM体系架构-计算机基础

2024-03-16 00:32:01 26 阅读
tvm android_rpc_test.py执行报错解决

2024-03-16 00:32:01 19 阅读
【Numpy】基础学习：一文了解np.newaxis的作用、用法

2024-03-16 00:32:01 21 阅读
【Python】科研代码学习：九 parser，argparse，HfArgumentParser

2024-03-16 00:32:01 20 阅读
智能网联汽车网络安全威胁具体

2024-03-16 00:32:01 19 阅读
php.exe运行时，提示缺少VCRUNTIME140.dll

2024-03-16 00:32:01 20 阅读
Nodejs引入模块运行时报错

2024-03-16 00:32:01 21 阅读
IntelliJ IDEA Dev 容器

2024-03-16 00:32:01 21 阅读
SpringSecurity 快速入门

2024-03-16 00:32:01 19 阅读
python自动化之pytest框架以及数据驱动（第五天）

2024-03-16 00:32:01 20 阅读
Docker 容器化技术：构建高效、可移植的开发环境和部署流程｜Docker 的分层设计

2024-03-16 00:32:01 17 阅读
外卖平台订餐流程架构的实践

2024-03-16 00:32:01 18 阅读
ReactNative项目构建分析与思考之react-native-gradle-plugin

2024-03-16 00:32:01 16 阅读
vue若依自定义权限控制

2024-03-16 00:32:01 16 阅读
python3：No module named ‘pandas‘

2024-03-16 00:32:01 18 阅读
安卓自定义ScrollView

2024-03-16 00:32:01 19 阅读
Web前端依赖版本管理最佳实践

2024-03-16 00:32:01 19 阅读
Prometheus 监控告警配置

2024-03-16 00:32:01 20 阅读
STM32CubeMX学习笔记19——SD卡（SDIO接口）

2024-03-16 00:32:01 19 阅读
技术问题记录

2024-03-16 00:32:01 22 阅读
Spring Cloud面试系列-01

2024-03-16 00:32:01 24 阅读
【gpt实践】实用咒语分享

2024-03-16 00:32:01 25 阅读
uniapp内实现链接跳转到浏览器网页上

2024-03-16 00:32:01 22 阅读