Llama2模型本地部署(Mac M1 16G)

环境准备

环境:Mac M1 16G、Conda

Conda创建环境配置

使用Anaconda-Navigator创建python 3.8环境

切换到新建的conda环境:

conda activate llama38

llama.cpp

找一个目录,下载llama.cpp

git clone https://github.com/ggerganov/llama.cpp

进入llama.cpp目录

cd llama.cpp

安装依赖环境

pip install -r requirements.txt

编译代码

LLAMA_METAL=1 make

下载中文模型 chinese-alpaca-2-7b-64k-hf,可以去下面的地址查找GitHub - ymcui/Chinese-LLaMA-Alpaca-2: 中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models) 

我这边选用的7b模型,再大就不好运行起来了

下载后放置在llama.cpp/models目录下

模型转换

python convert.py models/chinese-alpaca-2-7b-64k-hf/

量化模型

./quantize ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-f16.gguf ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-q4_0.gguf q4_0

Server方式启动, host和port可选, 不写则启动127.0.0.1 8080

./server --host 0.0.0.0 --port "$port" -m ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-q4_0.gguf -c 4096 -ngl 1

启动成功直接打开页面,我这边没有指定host和port,http://localhost:8080/

开始对话

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-13 06:02:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-13 06:02:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-13 06:02:05       87 阅读
  4. Python语言-面向对象

    2024-04-13 06:02:05       96 阅读

热门阅读

  1. mac下docker搭建nginx+php+mysql,并实现nginx负载均衡

    2024-04-13 06:02:05       38 阅读
  2. Qt中的事件与事件处理

    2024-04-13 06:02:05       60 阅读
  3. 浅析云算力平台的优势及关键点

    2024-04-13 06:02:05       40 阅读
  4. CSRF

    CSRF

    2024-04-13 06:02:05      72 阅读
  5. WPF —— GDI画板

    2024-04-13 06:02:05       45 阅读
  6. 15. 登录页案例

    2024-04-13 06:02:05       36 阅读
  7. comp21 Python web computer language

    2024-04-13 06:02:05       36 阅读
  8. SQLMap简单注入教程

    2024-04-13 06:02:05       46 阅读