LLM之Agent再探

2024-01-05 16:52:01
开发
63

文章目录

前言
思考
解决办法
总结

前言

重要： 阅读该文章之前，一定要先阅读：LLM之Agent初探

1、当业务中有大量的tool时，比如有上千个，这些tool的描述加起来，总长度已经大大超过了LLM的最大输入长度，即使能接受这么长的token，从attention机制来看，效果也好不到哪里去。

2、在LLM完成指令时，这几千个tool也不是都会被用上，那些没被用上的tool，且没被使用的tool占了绝大部分，大量的没被使用的tool占着大部分输入的token，造成资源的浪费，且推理性能也会有所下降。

基于以上两点考虑，尽量将与实际指令相关的tool加载进agent，丢弃那些不太可能会用到的tool是十分有必要的。

原文地址:https://blog.csdn.net/qq_44193969/article/details/135410862 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1743193620200165376.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-01-05 16:52:01 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-01-05 16:52:01 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-01-05 16:52:01 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-01-05 16:52:01 100 阅读
NoSQL之Redis非关系型数据库

2024-01-05 16:52:01 101 阅读
2024.7.22 作业

2024-01-05 16:52:01 96 阅读
GDB调试正在运行的程序

2024-01-05 16:52:01 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-01-05 16:52:01 85 阅读
在Django里面运行非项目文件

2024-01-05 16:52:01 82 阅读
SSD基本架构与工作原理

2024-01-05 16:52:01 87 阅读
在誉天学习完HCIE就业吗？

2024-01-05 16:52:01 93 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-01-05 16:52:01 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-01-05 16:52:01 85 阅读
go 协程池的实现

2024-01-05 16:52:01 88 阅读
Shell脚本循环语句与函数

2024-01-05 16:52:01 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-01-05 16:52:01 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-01-05 16:52:01 85 阅读
四大引用——强软弱虚

2024-01-05 16:52:01 86 阅读
Python语言-面向对象

2024-01-05 16:52:01 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-01-05 16:52:01 85 阅读
网站安全-CDN篇

2024-01-05 16:52:01 88 阅读

热门阅读

Flink学习-处理函数

2024-01-05 16:52:01 56 阅读
【GO语言卵细胞级别教程】01.GO基础知识

2024-01-05 16:52:01 54 阅读
Go语言基本数据类型

2024-01-05 16:52:01 57 阅读
YOLOv8改进添加新型卷积注意力框架SegNext_Attention

2024-01-05 16:52:01 66 阅读
注册中心与服务发现环境搭建实例--Eureka和Nacos

2024-01-05 16:52:01 48 阅读
argparse学习使用

2024-01-05 16:52:01 66 阅读
Elasticsearch 优化

2024-01-05 16:52:01 50 阅读
【Python可视化实战】钻石数据可视化

2024-01-05 16:52:01 41 阅读
Golang里空结构体struct{}的介绍和使用

2024-01-05 16:52:01 45 阅读
打造私域流量的知识付费小程序saas租户平台

2024-01-05 16:52:01 64 阅读
pandas.DataFrame() 数据自动写入Excel

2024-01-05 16:52:01 54 阅读
Spring中的ApplicationContext和BeanFactory的区别？？

2024-01-05 16:52:01 51 阅读
YOLOv5算法进阶改进（10）— 更换主干网络之MobileViTv3 | 轻量化Backbone

2024-01-05 16:52:01 69 阅读
计算机网络问题

2024-01-05 16:52:01 56 阅读
低代码UI构件程序设计基础实训一

2024-01-05 16:52:01 59 阅读
CentOS 开启BBR

2024-01-05 16:52:01 53 阅读
jupyter更改默认路径到其它的目录或者到其它的盘比如D盘

2024-01-05 16:52:01 55 阅读
新年福利｜这款价值数万的报表工具永久免费了

2024-01-05 16:52:01 58 阅读
vue3 插槽 slot 使用

2024-01-05 16:52:01 46 阅读
网络安全基础之访问控制模型详解——DAC, MAC, RBAC

2024-01-05 16:52:01 54 阅读
MySQL 存储引擎对比：InnoDB vs. MyISAM

2024-01-05 16:52:01 50 阅读
flutter 五：MaterialApp

2024-01-05 16:52:01 51 阅读
使用flutter开发一个简单的轮播图带指示器的组件

2024-01-05 16:52:01 61 阅读
MacOS - 苹果电脑程序还能正常启动，但图标消失不见了~

2024-01-05 16:52:01 38 阅读
Spring Boot中进行分库编程

2024-01-05 16:52:01 50 阅读
架构师使用的8种重要生命周期图

2024-01-05 16:52:01 65 阅读
C#：如何产生一个临时文件

2024-01-05 16:52:01 50 阅读
EViews12安装包下载及安装教程

2024-01-05 16:52:01 57 阅读
数据库-创建表

2024-01-05 16:52:01 57 阅读
【瞎折腾/3D】无父物体下物体的旋转与移动

2024-01-05 16:52:01 55 阅读