AI大模型预先学习笔记一:transformer和fine tune技术介绍

一、商业观点:企业借助大模型获得业务增长可能

在这里插入图片描述

二、底层原理:transformer

1)备注

①下面每个步骤都是自回归的过程(aotu-regressive):已输出内容的每个字作为输入,一起生成下一个字
②合起来就是:y1输出之后,y1和x序列一起作为输出,来生成y2;y1和y2加x序列作为输入,来输出y3
③GPT3.5有1750亿参数,也就是1750亿维

2)运行步骤

①把一串输入的字符串拆分成x序列的结构
②再把这串x序列的输入字符串映射成z序列
(z序列是:z1、z2、z3、z4等,不一定必须是512维),每个z是512维坐标的向量,由512个坐标构成
解码器根据传入的z序列生成y序列

3)编码器框架图

在这里插入图片描述
①左边是编码器,右边是解码器
②输入有两个预处理
1)input Embedding:把每个字都变成512个字去描述
2)positionnal Encoding:不仅要把每个字换成512个描述,而是还要关注每个字的位置(也就是关注词的主谓宾)
linear做类似线性回归的东西
softmax:把前序所有的计算结果转化成概率数字,有了概率数字才会知道蹦出来的下个数字是什么
⑤注意力机制(attention机制):抓住主要的词汇(每个词的重要程度通过权重数值和权重矩阵体现出来)
self-attention(自注意力模型):不是给某些搜索方向提前标注大权重的词 (从注意到self-attention自注意力机制)

⑦q\k\v三矩阵在做线性代数(q矩阵和k矩阵做了很多点乘和像素计算得到v矩阵):
q:问题
k:固定的二维数组
v:权重数值

三、应用技术:fine tune介绍

1)三层分层

①第一层:
指令编程(不停跟大模型对话总结经验)、AI编程、AI测试
②第二层:
向量数据库、向量检索、langchain、sk、智能体(autogpt这样的东西)
③第三层:
模型定制:fine tune(专业领域就不行了)

2)原理讲解

  • 步骤
    ①收集示范数据(制定了很多prompt)
    ②收集比较数据,并训练奖励模型(fine tuning)
    ③使用强化学习针对奖励模型优化策略
  • 解释
    ①fine tune就是对参数小范围的波动微调下

3)中文版原理讲解(第一步只要一次,第二和第三要很多次)

①step 1:
1)组织很多数据(a labeler),就比如说律师的官司一问一答(只做一次
2)这些数据就是对这些不咋地的数据进行fine tune(模型精调,这些过程叫SFT)
②step2:
根据你的问题排序(rank)之前生成的labelers
③step 3:
能得到人类更好的内容将会得到更多积分,强化学习

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

链接

最近更新

  1. TCP协议是安全的吗?

    2024-01-17 11:26:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-17 11:26:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-17 11:26:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-17 11:26:02       18 阅读

热门阅读

  1. 音视频-SDL的简单使用

    2024-01-17 11:26:02       30 阅读
  2. php中项目目录下.htaccess文件讲解

    2024-01-17 11:26:02       29 阅读
  3. 开发人员应该了解哪些 SQL 知识?

    2024-01-17 11:26:02       34 阅读
  4. 加快网络安全事件响应速度的6个步骤

    2024-01-17 11:26:02       41 阅读
  5. GoLang刷题之leetcode

    2024-01-17 11:26:02       33 阅读
  6. 数据结构(五)数据结构与算法中的经典题

    2024-01-17 11:26:02       31 阅读
  7. C++中的算法与数据结构优化技巧

    2024-01-17 11:26:02       31 阅读
  8. 方案:如何列出 Jira 中授予用户的所有权限

    2024-01-17 11:26:02       39 阅读
  9. 数据结构-无向图(C++)

    2024-01-17 11:26:02       22 阅读
  10. 121_买卖股票的最佳时机

    2024-01-17 11:26:02       26 阅读
  11. 11.spring boot 启动源码(一)

    2024-01-17 11:26:02       34 阅读
  12. UDP和TCP

    2024-01-17 11:26:02       33 阅读
  13. 物流实时数仓DWD层——1.准备工作

    2024-01-17 11:26:02       25 阅读