AGI|Open Interpreter利用Code Interpreter实现本地化

目录

一、前言

二、Open Interpreter 介绍

三、核心特点

四、基本使用

4.1:安装部署

4.2、本地运行

五、使用示例

5.1:文件处理内容分析

5.2:数学计算

5.3、联网支持

5.4、链接使用数据库的能力发掘

六、总结


一、前言

去年7月,OpenAI发布了一个强大的插件,名为Code Interpreter(代码解释器),它可以根据用户的自然语言需求生成并执行代码解决方案,帮助完成各种任务,如数据分析、图表创建和文件编辑等。

尽管OpenAI的GPT-4代码解释器改变了游戏规则,但它也有一些特定的限制。OpenAI的解决方案是托管的,它在受控的远程环境中运行,限制了开发人员对本地设置的控制。这导致了一些明显的限制,比如无法访问互联网、有限的预安装软件包、最大上传大小为100MB以及运行时间限制为120秒。而且,当环境终止时,任何生成的文件或链接都会丢失,对于长时间运行的任务可能会带来不便。

然而,现在有一个名为Open Interpreter的开源项目解决了这些问题。Open Interpreter可以在本地环境中运行,可以访问互联网,没有文件大小和运行时间的限制,并且可以利用任何包或库。正式发布的Open Interpreter在短短不到一周的时间内就获得了惊人的16.8k stars,可见其受欢迎程度。

二、Open Interpreter 介绍

Open Interpreter是一个开源工具,提供交互式和编程聊天功能,让用户可以通过在终端中运行解释器与其进行对话。开发人员可以编写任务和工作流程脚本,直接传递消息给解释器,以便更精确地控制。用户可以检查和配置系统消息,以满足个人偏好和项目要求的灵活性。

Open Interpreter 不仅仅是另一个编码解释器。它是一个专注于复杂任务的强大工具,允许语言模型在您的计算机上运行代码,以完整地编写应用程序、任务等。它是 OpenAI 代码解释器的实现,可以运行 GPT4 和其他模型,支持 Python、JavaScript、Shell 等语言的代码。

Open Interpreter 的独特功能之一是其终端中类似聊天的界面,允许用户以更直观和用户友好的方式与之交互。该解释器不仅可以编写代码,还可以创建和编辑照片、视频、PDF 和其他文件。它可以控制网络浏览器进行网络搜索,并通过网络上的不同区域进行搜索,以实现并提供必要的链接。

三、核心特点

Open Interpreter 的核心特点包括:

  • 互联网访问自由:
    在本地运行的 Open Interpreter 可以完全访问互联网,允许免费访问外部API和数据库,提高项目的灵活性。
  • 包和库选择:
    Open Interpreter允许使用任何包或库,使您能够选择最适合您项目的工具。
  • 无限的运行时间和文件大小:
    Open Interpreter没有执行时间或文件大小的限制,可以顺利进行大规模数据分析和计算处理。
  • 确保安全性:
    在执行代码之前,Open Interpreter需要用户确认,以防止执行未经授权的代码,提高安全性。
  • 物有所值:
    Open Interpreter是一个免费的开源项目,对于初创公司和个人开发人员来说,降低成本是一个重要优势。
  • 支持多种编程语言:
    Open Interpreter不仅支持Python,还支持JavaScript、Bash等多种编程语言,适用于更广泛的应用程序。

总之,Open Interpreter是一个多功能且灵活的开源编程工具,具有本地行为、多语言支持、包和库选择、无限运行时间和文件大小、高级安全性以及物有所值等特点。这些特性极大地提高了项目的灵活性和效率,使其成为广泛用户,包括初创公司、大型企业和个人开发人员的有用工具。

四、基本使用

4.1:安装部署

安装完成后,在 Terminal 输入 interpreter 就可以启动使用 Open Interpreter。默认会提示输入OPENAI_API_KEY,则使用 GPT-4 执行,否则使用本地 Code-LLama 执行。如果使用azure openai则需要输入azure/openai,更多其他模型的使用请参考https://docs.openinterpreter.com/guides

4.2、本地运行

Open Interpreter 允许 LLM 在本地运行 Python、Javascript、Shell 等语言的代码。如果没有 GPT-4 API,也可以通过如下命令行使用开源模型 Code Llama如果您将其与 openai 型号一起使用,首次安装时较小 (50kb) 。如果您使用 code-llama 在本地运行它(它会为您安装它,让您选择模型大小),则大小从 3GB 到 30GB 不等。如果您运行 interpreter --local,它会自动安装并使用 Code Llama。

例如输出hello world,open interpreter在执行任意代码之前都会要求确认

五、使用示例

5.1:文件处理内容分析

可以看到 Open Interpreter 使用名为 pandas的 Python 库来解决它,最终成功编写完程序并执行获取到结果。

5.2:数学计算

5.3、联网支持

自从GPT-4关闭联网功能之后,基本上没有几个大模型可以很好的实现联网能力,Open Interpreter 可以完全访问互联网,允许免费访问外部API和数据库,提高项目的灵活性。例如我们输入查询:“获取全球人工智能领域LLM大语言模型相关的10条最新新闻”

OpenInterpreter首先会根据输入的问题整理好解决问题的思路,然后按步骤来完成并一步步去实现

可以看到在 Open Interpreter 的执行过程中,对于出现的错误也能很好的自我进行修复,最终完成了结果的输出。

5.4、链接使用数据库的能力发掘

可以直接在提示词中输入需要处理的内容和链接信息或以文件的形式读取,告诉大模型相关信息

在输入的信息足够的情况下可以让模型自动生成相关的sql语句,完成复杂任务的执行。

除了以上的示例之外,还能使用open interpreter进行图表分析绘制,提取分析视频等各类更复杂的任务,充分发觉大模型的潜力。

六、总结

Open Interpreter 是一个突破性的开源项目,它不仅解决了OpenAI GPT-4代码解释器在远程环境中运行所带来的诸多限制,还为开发人员提供了更广泛的功能和灵活性。

作为一个可以在本地环境中运行的工具,Open Interpreter可以访问互联网,没有文件大小和运行时间的限制,并且可以利用任何包或库。它的出现,使得开发人员能够更自由地进行内容创建、数据处理以及各种任务的执行。此外,Open Interpreter还提供了交互式和编程聊天功能,使得用户可以通过在终端中运行解释器与其进行对话,更精确地控制任务和工作流程。

Open Interpreter不仅是一个编码解释器,它还是一个强大的工具,专注于处理复杂任务,将GPT-4代码解释器的强大功能与本地开发环境的灵活性完美结合在一起。

参考资料

1、https://docs.openinterpreter.com

2、https://github.com/OpenInterpreter/open-interpreter

3、https://zhuanlan.zhihu.com/p/676974186

4、https://zhuanlan.zhihu.com/p/655719282

作者:刘忠励|神州数码云基地

版权声明:本文由神州数码云基地团队整理撰写,若转载请注明出处。

公众号搜索神州数码云基地,了解更多技术干货。

相关推荐

  1. HuggingFace学习笔记--利用API实现简单的NLP任务

    2024-06-06 02:34:01       33 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-06 02:34:01       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-06 02:34:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-06 02:34:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-06 02:34:01       20 阅读

热门阅读

  1. ASP.NET Core 增加后台定时托管任务

    2024-06-06 02:34:01       9 阅读
  2. 阿里云计算之Linux目录学习笔记(三)

    2024-06-06 02:34:01       6 阅读
  3. python多线程

    2024-06-06 02:34:01       14 阅读
  4. Redis一键巡检脚本

    2024-06-06 02:34:01       8 阅读
  5. MySQL 连接池在 Python 中的深度探索与实践

    2024-06-06 02:34:01       10 阅读
  6. FreeRTOS学习笔记-基于stm32(10)事件标志组

    2024-06-06 02:34:01       10 阅读
  7. MySql和Oracle表分区

    2024-06-06 02:34:01       10 阅读
  8. 14.FreeRTOS 流媒体缓存 Stream Buffer

    2024-06-06 02:34:01       9 阅读
  9. tcp三次握手四次挥手

    2024-06-06 02:34:01       11 阅读