【LLM-推理】Self-Refine：使用feedback迭代修正LLM的Output

2024-07-21 10:24:01
开发
17

来源： https://selfrefine.info/

1.论文速读(摘要+引言)

本文主要提出了Self-Refine策略，旨在通过一个LLM不断refine修正LLM的输出，使其在无需额外训练的情况下，在下游任务产生更好的效果。

该方法的直观Insight：我们在写一封 email 时，往往写出一个 draft，然后再修改其中措辞不当的地方，修改为更好的版本。
其思路如下图：
请添加图片描述

首先，给定一个 input x，在 prompt pgen下让 LLM 先生成一个初始 outputy0。
进行迭代，每一轮 t 中：
- Feedback：将 input x、上一轮 output y(t) 和 prompt p(fb)给 LLM，得到这一轮的 feedback f(bt)。【feedback的prompt】
- Refine：将 input x 、历史的所有 feedback 和 output、prompt P(refine) 给 LLM，得到这一轮的 output T(t+1)。【refine重新优化的prompt】

如此迭代，直到 feedback 中被检查出有stop标识符，或者达到了最大迭代次数。

2.方法 method

给定输入，self-refine生成最初的输出，根据该输出提出反馈，然后根据反馈优化输出。直到得到满意的答案。self-refine依靠LLM和三个prompts（生成输出的Prompt，生成反馈的Prompt，根据反馈优化输出的优化Prompt）
在这里插入图片描述

3.评估

主要在这几个任务进行评估：

对话生成
代码优化
代码可读性提升数学推理
反转情绪
缩写词生成
限制性生成

Metrics指标效果：
Math reasoning %解决率，code optimization:% 代码优化率，Acronym Generation：%受限生成
在这里插入图片描述

原文地址:https://blog.csdn.net/weixin_57128596/article/details/140546229 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1814848776972668928.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

【LLM-推理】Self-Refine：使用feedback迭代修正LLM的Output

2024-07-21 10:24:01 18 阅读
LLM: Prompt的使用

2024-07-21 10:24:01 35 阅读
迭代器的使用

2024-07-21 10:24:01 23 阅读
【LLM 论文】Self-Consistency — 一种在 LLM 中提升 CoT 表现的解码策略

2024-07-21 10:24:01 96 阅读
大模型（LLM）的推理加速

2024-07-21 10:24:01 26 阅读
LLM的7种推理框架

2024-07-21 10:24:01 21 阅读
LLMs推理框架总结

2024-07-21 10:24:01 62 阅读
LLM推理优化

2024-07-21 10:24:01 29 阅读
使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署

2024-07-21 10:24:01 18 阅读
GoT 思维图：使用图论来建模并增强LLMs的推理过程

2024-07-21 10:24:01 19 阅读

最近更新

题解 - 序列

2024-07-21 10:24:01 69 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-21 10:24:01 57 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-21 10:24:01 52 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-21 10:24:01 54 阅读
NoSQL之Redis非关系型数据库

2024-07-21 10:24:01 61 阅读
2024.7.22 作业

2024-07-21 10:24:01 61 阅读
GDB调试正在运行的程序

2024-07-21 10:24:01 46 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-21 10:24:01 49 阅读
在Django里面运行非项目文件

2024-07-21 10:24:01 45 阅读
SSD基本架构与工作原理

2024-07-21 10:24:01 52 阅读
在誉天学习完HCIE就业吗？

2024-07-21 10:24:01 58 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-21 10:24:01 49 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-21 10:24:01 51 阅读
go 协程池的实现

2024-07-21 10:24:01 50 阅读
Shell脚本循环语句与函数

2024-07-21 10:24:01 51 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-21 10:24:01 55 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-21 10:24:01 50 阅读
四大引用——强软弱虚

2024-07-21 10:24:01 54 阅读
Python语言-面向对象

2024-07-21 10:24:01 55 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-21 10:24:01 50 阅读
网站安全-CDN篇

2024-07-21 10:24:01 51 阅读

热门阅读

【python学习】思考-python分发和提交到git的区别以及用venv、pycharm以及conda创建虚拟环境的区别

2024-07-21 10:24:01 11 阅读
CyclicBarrier循环栅栏介绍和使用

2024-07-21 10:24:01 13 阅读
Docker+consul容器服务的更新与发现

2024-07-21 10:24:01 12 阅读
配置VSCode+Anaconda的PyTorch GPU环境笔记

2024-07-21 10:24:01 18 阅读
Win11系统提示找不到lprhelp.dll文件的解决办法

2024-07-21 10:24:01 15 阅读
cadence SPB17.4 - CIS Configuration - setup

2024-07-21 10:24:01 13 阅读
n7.Nginx 第三方模块

2024-07-21 10:24:01 15 阅读
Python常用的数据类型

2024-07-21 10:24:01 12 阅读
Android笔试面试题AI答之控件Views（1）

2024-07-21 10:24:01 15 阅读
Spring中的AOP详解

2024-07-21 10:24:01 16 阅读
【Vue】重新理解Vue-Router中的两种路由模式

2024-07-21 10:24:01 18 阅读
基于微信小程序图书馆座位预约系统设计与实现

2024-07-21 10:24:01 16 阅读
数字通云平台智慧政务OA PayslipUser SQL注入漏洞复现

2024-07-21 10:24:01 16 阅读
【音视频】音频重采样

2024-07-21 10:24:01 17 阅读
IEEE论文发布

2024-07-21 10:24:01 20 阅读
Emacs有什么优点，用Emacs写程序真的比IDE更方便吗?

2024-07-21 10:24:01 15 阅读
【CSS】基本用法

2024-07-21 10:24:01 16 阅读
Transformer系列总结

2024-07-21 10:24:01 11 阅读
全球历年人口总数统计报告

2024-07-21 10:24:01 17 阅读
Unity项目配置和启动

2024-07-21 10:24:01 14 阅读
塔子哥的循环序号-美团2023笔试(codefun2000)

2024-07-21 10:24:01 16 阅读
网络编程中的TCP和UDP

2024-07-21 10:24:01 19 阅读
检索增强生成Retrieval-Augmented Generation（RAG）简介

2024-07-21 10:24:01 14 阅读
sqlalchemy事件监听

2024-07-21 10:24:01 14 阅读
思维，CF1990 C - Mad MAD Sum

2024-07-21 10:24:01 18 阅读
如何解决热插拔时的电压过冲

2024-07-21 10:24:01 19 阅读
【Python 已解决】ImportError：无法从django.utils.encoding导入force_text

2024-07-21 10:24:01 17 阅读
MySQL单表分组查询

2024-07-21 10:24:01 12 阅读
Linux云计算 |【第一阶段】SERVICES-DAY1

2024-07-21 10:24:01 14 阅读
Nuxt.js与Serverless：构建无服务器应用

2024-07-21 10:24:01 15 阅读