Llama3 在线试用与本地部署

美国当地时间4月18日,Meta 开源了 Llama3 大模型,目前开源版本为 8B 和 70B 。Llama 3 模型相比 Llama 2 具有重大飞跃,并在 8B 和 70B 参数尺度上建立了 LLM 模型的新技术。由于预训练和后训练的改进,Llama3 模型是目前在 8B 和 70B 参数尺度上存在的最好的模型。训练后程序的改进大大降低了错误拒绝率,改善了一致性,增加了模型响应的多样性。我们还看到了推理、代码生成和指令跟踪等功能的极大改进,使 Llama 3 更具可操控性。

简介:

Llama3 是 Meta AI 公司开发的一个基于 transformer 架构的大型语言模型,可以生成人类般的文本,回答问题,甚至进行创作,具有强大的语言理解和生成能力。

特点

  1. 大规模参数:Llama3 拥有超过 650 亿个参数,使其能够学习和存储大量的语言知识。
  2. 多任务学习:Llama3 可以同时学习多种语言任务,如文本生成、问答、文本分类等。
  3. 强大的生成能力:Llama3 可以生成长文本、诗歌、故事等多种形式的文本,具有很强的创作能力。
  4. 多语言支持:Llama3 支持多种语言,包括英语、西班牙语、法语、德语、意大利语等。

应用场景

  1. 文本生成:Llama3 可以用于自动生成文本,例如生成文章、新闻、产品描述等。
  2. 问答系统:Llama3 可以用于构建问答系统,回答用户的问题。
  3. 语言翻译:Llama3 可以用于语言翻译,例如将英语翻译成其他语言。
  4. 创作工具:Llama3 可以用于创作工具,例如生成诗歌、故事等。

优点

  1. 高准确率:Llama3 具有很高的准确率,可以生成高质量的文本。
  2. 强大的生成能力:Llama3 可以生成多种形式的文本,具有很强的创作能力。
  3. 多语言支持:Llama3 支持多种语言,能够满足不同语言用户的需求。

缺点

  1. 计算资源需求高:Llama3 需要强大的计算资源,否则可能无法运行。
  2. 需要大量数据:Llama3 需要大量的训练数据,否则可能无法达到理想的效果。

在线试用:

不愧为 AI 浪潮里卖铲子的,NVIDIA 具有其他公司无可比拟的 AI 算力,在线上,给出了 llama3-70b 试用:

也可以通过代码来调用:

from openai import OpenAI

client = OpenAI(
  base_url = "https://integrate.api.nvidia.com/v1",
  api_key = "$API_KEY_REQUIRED_IF_EXECUTING_OUTSIDE_NGC"
)

completion = client.chat.completions.create(
  model="meta/llama3-70b-instruct",
  messages=[{"role":"user","content":"介绍一下llama3,用中文"}],
  temperature=0.5,
  top_p=1,
  max_tokens=1024,
  stream=True
)

for chunk in completion:
  if chunk.choices[0].delta.content is not None:
    print(chunk.choices[0].delta.content, end="")

本地部署:

下载安装Ollama

Ollama是专门为本地化运行大模型设计的软件,可以运行大多数开源大模型,如llama,gemma,qwen等,首先去官网下载Ollama软件:https://ollama.com/ ,最简单的方式是使用Docker 来跑, 此次运行是包括web端的一起运行,所以使用docker-compose打包一起运行以下容器:

  • ollama/ollama:latest

  • open-webui:latest

下载模型

在Ollama官方的Models栏目中,找到我们要的模型, 直接访问这个链接:https://ollama.com/library/llama3。

在cmd命令行中运行命令:ollama pull llama3:8b,下载模型。

本地使用

总的来说,Llama3 是一个功能强大且灵活的语言模型,可以应用于多种语言任务和场景。

                                                                                         老徐,2024/4/29

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-04-29 14:46:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-29 14:46:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-29 14:46:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-29 14:46:01       18 阅读

热门阅读

  1. Vue.js(过渡)

    2024-04-29 14:46:01       12 阅读
  2. Linux内核驱动开发-001字符设备开发-002led杂项驱动

    2024-04-29 14:46:01       10 阅读
  3. Stylus入门使用方法

    2024-04-29 14:46:01       12 阅读
  4. UKP3D轴侧图出图按照哪些标准

    2024-04-29 14:46:01       9 阅读
  5. 在docker中安装paddle serving @FreeBSD(待续)

    2024-04-29 14:46:01       10 阅读
  6. c++课堂——动态规划

    2024-04-29 14:46:01       13 阅读
  7. 【排序算法】快速排序

    2024-04-29 14:46:01       11 阅读