【Ollama】AI大模型本地部署

Ollama

Ollama轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLM)。提供了一个简单的API来创建、运行和管理模型,以及一个预构建模型库,可以轻松用于各种应用程序。

明显优势:易于使用、轻量级、可扩展、预构建模块库
人群价值:研究人员、开发人员、爱好者
应用场景:文本生成、翻译、问答、代码生成
项目优点:易用性、性能、功能、社区

容器

在这里插入图片描述

文件

  • docker-compose.ollama.yml
version: '3.5'
services:
  ollama:
    #restart: always
    container_name: ai-ollama-serve
    image: ollama/ollama
    ports:
      - 8000:8000
    environment:
      - OLLAMA_HOST=0.0.0.0:8000
      - OLLAMA_MODELS=/data/models
    #volumes:
    #  - ./ollama_serve/models:/data/models  # 先注释
    # 命令启动 serve
    command: serve

  ollama-webui:
    #restart: always
    container_name: ai-ollama-webui
    image: ghcr.io/open-webui/open-webui:main
    ports:
      - 3000:8080
    environment:
      - OLLAMA_BASE_URL=http://【地址】:8000
    #volumes:
      #- ./ollama-webui/backend/data:/app/backend/data # 先注释


##################### 使用ollama部署大模型 #####################
# docker-compose -f docker-compose.ollama.yml up -d
# OLLAMA_HOST       The host:port to bind to (default "127.0.0.1:11434")
# OLLAMA_ORIGINS    A comma separated list of allowed origins.
# OLLAMA_MODELS     The path to the models directory (default is "~/.ollama/models")
 
# llama2 | qwen:0.5b-chat  | llava  | llama2-chinese
# https://github.com/open-webui/open-webui#troubleshooting
# 拷贝到本地存
# docker cp ai-ollama-serve:/data/models/ ./ollama_serve/models/
# docker cp ai-ollama-webui:/app/backend/data/ ./ollama-webui/backend/ 

运行docker-compose -f docker-compose.ollama.yml up -d

验证

服务端

在这里插入图片描述

  • 运行
ollama run qwen:0.5b-chat

在这里插入图片描述

网页端

在这里插入图片描述

在这里插入图片描述

使用

在这里插入图片描述

快捷

https://ollama.com
https://ollama.com/library/qwen
https://github.com/open-webui/open-webui

相关推荐

  1. 【一】Mac 本地部署模型

    2024-03-28 08:56:02       35 阅读
  2. Ollama+AnythingLLM搭建部署本地模型AI知识库

    2024-03-28 08:56:02       127 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-28 08:56:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-28 08:56:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-28 08:56:02       82 阅读
  4. Python语言-面向对象

    2024-03-28 08:56:02       91 阅读

热门阅读

  1. C语言和C++实现栈Stack的对比,有什么区别?

    2024-03-28 08:56:02       41 阅读
  2. Linux解压安装MongoDB

    2024-03-28 08:56:02       45 阅读
  3. 面试题-3.20

    2024-03-28 08:56:02       39 阅读
  4. 2024.3.27力扣(1200-1400)刷题记录

    2024-03-28 08:56:02       42 阅读
  5. Nacos-client 2.x 使用nginx配置

    2024-03-28 08:56:02       40 阅读
  6. Android知识 - 代码混淆ProGuard规则介绍

    2024-03-28 08:56:02       37 阅读
  7. http 超全状态码

    2024-03-28 08:56:02       32 阅读