Dify中接入GPT-4o mini模型

GPT-4o mini模型自己承认是基于GPT-3.5架构的模型,有图有真相:

一.GPT-4o mini官网简介

GPT-4o mini(“o"代表"omni”)是小型型号类别中最先进的型号,也是OpenAI迄今为止最便宜的型号。它是多模态的(接受文本或图像输入并输出文本),具有比 gpt-3.5-turbo 更高的智能,但速度同样快。它旨在用于较小的任务,包括视觉任务。建议在之前使用 gpt-3.5-turbo 的地方选择 gpt-4o-mini ,因为此模型功能更强大且更便宜。

模型 描述 上下文窗口 训练数据
gpt-4o-mini 新款 GPT-4o-mini经济实惠且智能的小型型号,适用于快速、轻量级的任务。 GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。当前指向 gpt-4o-mini-2024-07-18 。 128,000 tokens Up to Oct 2023
gpt-4o-mini-2024-07-18 gpt-4o-mini 当前指向此版本。 128,000 tokens Up to Oct 2023

二.Dify中接入gpt-4o-mini

1.openrouter下的gpt-4o-mini配置

在Dify 0.6.14版本中没有包含gpt-4o-mini,因为当时还没发布。

在Dify官方仓库发现已经有人提交了,不过看清楚是提交给openrouter供应商的。

2.openai下的gpt-4o-mini配置

(1)_position.yaml文件

接下来修改下提交给openai供应商。主要是修改dify\api\core\model_runtime\model_providers\openai\llm\_position.yaml文件增加gpt-4o-mini如下:

(2)gpt-4o-mini.yaml文件

然后在dify\api\core\model_runtime\model_providers\openai\llm目录增加gpt-4o-mini.yaml文件即可:

具体就不详细解释了,仿照gpt-4o.yaml写一个,主要是修改模型的名字,以及价格。

model: gpt-4o-mini
label:
  zh_Hans: gpt-4o-mini
  en_US: gpt-4o-mini
model_type: llm
features:
  - multi-tool-call
  - agent-thought
  - stream-tool-call
  - vision
model_properties:
  mode: chat
  context_size: 128000
parameter_rules:
  - name: temperature
    use_template: temperature
  - name: top_p
    use_template: top_p
  - name: presence_penalty
    use_template: presence_penalty
  - name: frequency_penalty
    use_template: frequency_penalty
  - name: max_tokens
    use_template: max_tokens
    default: 512
    min: 1
    max: 4096
  - name: response_format
    label:
      zh_Hans: 回复格式
      en_US: response_format
    type: string
    help:
      zh_Hans: 指定模型必须输出的格式
      en_US: specifying the format that the model must output
    required: false
    options:
      - text
      - json_object
pricing:
  input: "0.15"
  output: "0.60"
  unit: "0.000001"
  currency: USD

3.模型供应商查看和对话测试

参考文献

[1] gpt-4o-mini.yaml:https://github.com/sinomoe/dify/commit/9ba76915187cef8914c0bd5f6d920c82456ffcce

[2] https://platform.openai.com/docs/models/gpt-4o-mini

相关推荐

  1. 【AI大模型】如何在企业环境部署GPT-3/GPT-4模型

    2024-07-21 05:22:02       20 阅读
  2. Qt:实现gitdiff的功能

    2024-07-21 05:22:02       32 阅读
  3. git diff

    2024-07-21 05:22:02       33 阅读
  4. git diff

    2024-07-21 05:22:02       28 阅读
  5. GPT-4模型的创造力

    2024-07-21 05:22:02       44 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-21 05:22:02       51 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-21 05:22:02       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-21 05:22:02       44 阅读
  4. Python语言-面向对象

    2024-07-21 05:22:02       55 阅读

热门阅读

  1. 开源的语音合成工具_ChatTTS_用法及资源

    2024-07-21 05:22:02       18 阅读
  2. C++基础入门(一)(命名空间,输入输出,缺省参数)

    2024-07-21 05:22:02       15 阅读
  3. python中使用openpyxl库写一个简单的表格

    2024-07-21 05:22:02       13 阅读
  4. Spring Boot外部配置加载顺序

    2024-07-21 05:22:02       17 阅读
  5. 【前后端联调】MethodArgumentNotValidException

    2024-07-21 05:22:02       15 阅读
  6. Vue的自定义事件:组件间通讯的艺术

    2024-07-21 05:22:02       14 阅读
  7. Spring中存储Bean的相关注解及用法

    2024-07-21 05:22:02       17 阅读
  8. Perl中的时间机器:探索文件系统同步机制

    2024-07-21 05:22:02       15 阅读
  9. Perl异步编程新纪元:非阻塞I/O的魔力

    2024-07-21 05:22:02       18 阅读
  10. Perl线程调度优化:掌握线程优先级的艺术

    2024-07-21 05:22:02       13 阅读
  11. 渗透测试过程中如何做好个人防护?

    2024-07-21 05:22:02       19 阅读
  12. [ptrade交易实战] 第十七篇 期货交易类函数!

    2024-07-21 05:22:02       21 阅读
  13. 【C++11】initializer_list、可变参数模板详解

    2024-07-21 05:22:02       20 阅读
  14. 踏进互动科技世界使用Arduino

    2024-07-21 05:22:02       16 阅读
  15. 第五节shell脚本中的运行流程控制(1)(2)

    2024-07-21 05:22:02       18 阅读