LLM之Agent（三）：HuggingGPT根据用户需求自动调用Huggingface合适的模型

2023-12-08 23:54:01
开发
59

浙大和微软亚洲研究院开源的HuggingGPT，又名JARVIS，它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型，然后去Huggingface上直接调用对应的模型，最终给出用户的解决方案。

一、HuggingGPT的工作流程

它的工作流程包括四个阶段:

任务规划：ChatGPT将用户的需求解析为任务列表，并确定任务之间的执行顺序和资源依赖关系；
模型选择：ChatGPT根据HuggingFace上托管的各专家模型的描述，为任务分配合适的模型；
任务执行：混合端点（包括本地推理和HuggingFace推理）上被选定的专家模型根据任务顺序和依赖关系执行分配的任务，并将执行信息和结果给到ChatGPT；
响应生成：最后，由ChatGPT总结各模型的执行过程日志和推理结果，给出最终的输出。

下表展示了HuggingGPT的具体细节：

不同任务的任务规划评估，如下表所示：

任务规划的格式是： [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}]，参数的详细解释，如下表所示：

二、HuggingGPT的示例

假设我们有如下请求，来看一下HuggingGPT的完整流程：

请求：请生成一个女孩正在看书的图片，她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务，并分别选定模型执行得到最终结果的。

三、HuggingGPT不同任务的实验效果

参考文献：

[1] https://github.com/microsoft/JARVIS

[2] https://huggingface.co/spaces/microsoft/HuggingGPT

[3] https://arxiv.org/abs/2303.17580

[4] https://twitter.com/DrJimFan/status/1642563455298473986

原文地址:https://blog.csdn.net/wshzd/article/details/134797108 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1733152962659880960.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2023-12-08 23:54:01 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2023-12-08 23:54:01 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2023-12-08 23:54:01 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2023-12-08 23:54:01 100 阅读
NoSQL之Redis非关系型数据库

2023-12-08 23:54:01 101 阅读
2024.7.22 作业

2023-12-08 23:54:01 97 阅读
GDB调试正在运行的程序

2023-12-08 23:54:01 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2023-12-08 23:54:01 85 阅读
在Django里面运行非项目文件

2023-12-08 23:54:01 82 阅读
SSD基本架构与工作原理

2023-12-08 23:54:01 87 阅读
在誉天学习完HCIE就业吗？

2023-12-08 23:54:01 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2023-12-08 23:54:01 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2023-12-08 23:54:01 85 阅读
go 协程池的实现

2023-12-08 23:54:01 88 阅读
Shell脚本循环语句与函数

2023-12-08 23:54:01 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2023-12-08 23:54:01 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2023-12-08 23:54:01 85 阅读
四大引用——强软弱虚

2023-12-08 23:54:01 86 阅读
Python语言-面向对象

2023-12-08 23:54:01 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2023-12-08 23:54:01 85 阅读
网站安全-CDN篇

2023-12-08 23:54:01 88 阅读

热门阅读

12月07日，每日信息差

2023-12-08 23:54:01 52 阅读
嵌入式杂记 - MDK的Code, RO-data , RW-data, ZI-data意思

2023-12-08 23:54:01 58 阅读
【mysql】隔离级别以及其验证实例

2023-12-08 23:54:01 74 阅读
Docker 网络

2023-12-08 23:54:01 50 阅读
论文阅读[2022sigcomm]GSO-Simulcast Global Stream Orchestration in Simulcast Video

2023-12-08 23:54:01 59 阅读
mongdb配置ssl

2023-12-08 23:54:01 62 阅读
第54天：django学习（三）

2023-12-08 23:54:01 69 阅读
一个 postman实现参数化让我丢掉了一份20k的offer

2023-12-08 23:54:01 58 阅读
Android之知识总结第二篇

2023-12-08 23:54:01 59 阅读
【爬取二手车并将数据保存在数据库中】

2023-12-08 23:54:01 66 阅读
$双指针算法$

双指针算法

2023-12-08 23:54:01 62 阅读
麻雀1号开发板开箱

2023-12-08 23:54:01 61 阅读
了解linux网络时间服务器

2023-12-08 23:54:01 55 阅读
理解基于 Hadoop 生态的大数据技术架构

2023-12-08 23:54:01 69 阅读
Leetcode 345. Reverse Vowels of a String

2023-12-08 23:54:01 51 阅读
Android 断点调试

2023-12-08 23:54:01 62 阅读
第二十一章网络通信总结博客

2023-12-08 23:54:01 47 阅读
C语言第十七集(待修)

2023-12-08 23:54:01 51 阅读
电商早报 | 12月8日|母婴电商宝贝格子北京总部已人去楼空

2023-12-08 23:54:01 61 阅读
2024年网络安全行业前景和技术自学

2023-12-08 23:54:01 67 阅读
云原生的 CI/CD 框架tekton - Trigger（二）

2023-12-08 23:54:01 53 阅读
什么是ElasticSearch中的过滤器？

2023-12-08 23:54:01 64 阅读
在机器学习或者深度学习中是否可以直接分为训练集和测试集而不需要验证集？我的答案如下：

2023-12-08 23:54:01 67 阅读
golang开发框架

2023-12-08 23:54:01 55 阅读
SpringBoot学习笔记-实现微服务：匹配系统（下）

2023-12-08 23:54:01 59 阅读
自己开发组件更新到npm网站上通过npm install 安装保姆级别教程

2023-12-08 23:54:01 66 阅读
Vue2.0+ElementUI router页面跳转子路径问题

2023-12-08 23:54:01 49 阅读
vue2-使用vue-i18n搭建多语言切换环境

2023-12-08 23:54:01 62 阅读
C语言文本模式和二进制模式

2023-12-08 23:54:01 59 阅读
Opencv获取笔记本摄像头

2023-12-08 23:54:01 53 阅读