昇思25天学习打卡营第19天|MindNLP ChatGLM-6B StreamChat

昇思MindSpore应用实践

本系列文章主要用于记录昇思25天学习打卡营的学习心得。

ChatGML-6B简介

ChatGLM-6B 是由清华大学和智谱AI联合研发的产品,是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

基于MindNLP的ChatGLM-6B StreamChat

实验步骤:
1、导入MindNLP必要的模块:
AutoModelForSeq2SeqLM:用于自动加载适用于序列到序列任务的预训练模型。
AutoTokenizer:用于加载与模型相匹配的预训练分词器,用于文本的预处理和后处理。
gradio(别名gr):一个用于创建交互式机器学习界面的库。
mdtex2html:一个Markdown和LaTeX到HTML转换器。

2、导入ChatGLM-6B预训练模型
使用AutoModelForSeq2SeqLM.from_pretrained从指定源加载预训练的ChatGLM-6B大语言模型。

3、导入分词器
使用AutoTokenizer.from_pretrained加载与模型匹配的分词器。
分词器负责将原始文本转换成模型能理解的Token格式(通常是数字ID序列),并在生成文本后将其转换回可读的文本。

代码示例:

from mindnlp.transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import gradio as gr
import mdtex2html

model = AutoModelForSeq2SeqLM.from_pretrained('ZhipuAI/ChatGLM-6B', mirror="modelscope").half()  # .half()将模型的数据类型转换为半精度浮点数(float16)
model.set_train(False)  # 将模型设置为评估模式,关闭训练模式
tokenizer = AutoTokenizer.from_pretrained('ZhipuAI/ChatGLM-6B', mirror="modelscope")

prompt = '有个叫丽丽的人连麦到一个昵称叫李鑫和南方的网友,丽丽说:你好,李鑫,就喜欢跟你们南方人聊天,你们南方人就是别北方人有点素质,不是夸你们呢,李鑫回答:我是山东人。请问丽丽会怎么回复?'
history = []
response, _ = model.chat(tokenizer, prompt, history=history, max_length=500)
response

返回结果:
在这里插入图片描述
结论:大模型就是比丽丽有点素质!OK了,家人们~

Reference

[1] Github-ChatGLM-6B
[2]昇思大模型平台

相关推荐

  1. 25学习22|MindNLP ChatGLM-6B StreamChat

    2024-07-21 07:10:06       21 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-21 07:10:06       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-21 07:10:06       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-21 07:10:06       45 阅读
  4. Python语言-面向对象

    2024-07-21 07:10:06       55 阅读

热门阅读

  1. python与自动化运维相关的库有哪些?

    2024-07-21 07:10:06       13 阅读
  2. Programming Studio COSC2803

    2024-07-21 07:10:06       17 阅读
  3. Unity判断鼠标是否在UI上

    2024-07-21 07:10:06       14 阅读
  4. PCB(2)-布局

    2024-07-21 07:10:06       14 阅读
  5. 【NLP】Jieba中文分词

    2024-07-21 07:10:06       17 阅读
  6. 设计模式实战:多人聊天系统的设计与实现

    2024-07-21 07:10:06       15 阅读
  7. Open-Sora

    Open-Sora

    2024-07-21 07:10:06      18 阅读
  8. MYSQL2

    MYSQL2

    2024-07-21 07:10:06      17 阅读