2023春季李宏毅机器学习笔记 03 :机器如何生成文句

资料

  • 课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php
  • Github:https://github.com/Fafa-DL/Lhy_Machine_Learning
  • B站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800

一、大语言模型的两种期待和使用

BERT:专才

  • 简介:BERT是一个语言模型,对其进行改造(加外挂+微调参数),成为不同领域的专才(BERT只会进行文字填空,无法像GTP一样写出句子说话)
  • 本质:文字填空
  • 发展:专才 (单一任务完成度优秀,eg:专用于翻译的模型)
  • 使用方式:
    • (1)加外挂Head:
      在这里插入图片描述

    • (2)Fintune(微调参数):在这里插入图片描述

    • (3)Adapter(局部微调):在这里插入图片描述
      在这里插入图片描述

GPT:通才

  • 简介: 机器要学会读题目叙述Instruction Learning或题目范例In-context Learning
  • 本质:文字接龙
  • 发展:通才(只要重新设计Prompt,即可快速开发新功能不用写程式,eg:)
  • 使用方式:见二
    • Instruction Learning
    • In-context Learning
    • Chain of Thought (CoT) Prompting

相关推荐

  1. 2020机器学习课程笔记(二)- 深度学习

    2024-01-07 08:30:01       62 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-07 08:30:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-07 08:30:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-07 08:30:01       87 阅读
  4. Python语言-面向对象

    2024-01-07 08:30:01       96 阅读

热门阅读

  1. Android NumberPicker使用

    2024-01-07 08:30:01       62 阅读
  2. SQL SELECT 语句

    2024-01-07 08:30:01       56 阅读
  3. 大模型查询工具助手之股票免费查询接口

    2024-01-07 08:30:01       61 阅读
  4. 数据结构 —— 手写排序算法

    2024-01-07 08:30:01       74 阅读
  5. centoss7安装mysql详细教程

    2024-01-07 08:30:01       63 阅读
  6. Linux | 20 个常用的 Linux 基本指令

    2024-01-07 08:30:01       47 阅读
  7. 【思路】基于Spring实现配置的界面化修改

    2024-01-07 08:30:01       62 阅读
  8. Spring之IOC

    2024-01-07 08:30:01       42 阅读
  9. 【Springboot】基础业务学习笔记

    2024-01-07 08:30:01       56 阅读
  10. spring为什么要用三级缓存而不是二级缓存

    2024-01-07 08:30:01       58 阅读
  11. 判断回文字符串—C语言

    2024-01-07 08:30:01       65 阅读
  12. vue中debugger无法调试

    2024-01-07 08:30:01       60 阅读