书生·浦语大模型实战营之微调 Llama 3 实践与教程 (XTuner 版)

书生·浦语大模型实战营之微调 Llama 3 实践与教程 (XTuner 版)

Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,XTuner 团队对 Llama 3 微调进行了光速支持!!!开源同时社区中涌现了 Llama3-XTuner-CN 手把手教大家使用 XTuner 微调 Llama 3 模型。
XTuner:http://github.com/InternLM/XTuner
在这里插入图片描述

Llama3-XTuner-CN: https://github.com/SmartFlowAI/Llama3-XTuner-CN/
在这里插入图片描述

Llama 3 概览

首先我们来回顾一下 Llama 3 亮点概览~

  1. 首次出现 8B 模型,且 8B 模型与 70B模型全系列使用 GQA (Group Query Attention)。
  2. 最大模型达到 400B 规模大小,未来几个月内发布!
  3. 分词器由 SentencePiece 换为了 Tiktoken,与 GPT4 保持一致。
  4. 相比于 Llama2 的 32000 词表大小,L

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-23 05:12:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-23 05:12:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-23 05:12:03       82 阅读
  4. Python语言-面向对象

    2024-04-23 05:12:03       91 阅读

热门阅读

  1. docker部署sqlserver过程记录

    2024-04-23 05:12:03       26 阅读
  2. 13.接口自动化学习-Pytest结合Yaml使用

    2024-04-23 05:12:03       32 阅读
  3. LOD1-Unity中模型LOD技术原理以及使用

    2024-04-23 05:12:03       42 阅读
  4. MySQL-知识点详解

    2024-04-23 05:12:03       32 阅读
  5. Beego框架学习

    2024-04-23 05:12:03       35 阅读
  6. webSocket + springboot+vue3用法

    2024-04-23 05:12:03       33 阅读
  7. android wifi直连 wifip2pmanager

    2024-04-23 05:12:03       27 阅读