Mindspore 公开课 - prompt

prompt 介绍

Fine-Tuning to Prompt Learning

在这里插入图片描述

Pre-train, Fine-tune
  1. BERT
  • bidirectional transformer,词语和句子级别的特征抽取,注重文本理解
  • Pre-train: Maked Language Model + Next Sentence Prediction
  • Fine-tune: 根据任务选取对应的representation(最后一层hidden state输出),放入线性层中

例:Natural Language Inference

在这里插入图片描述

Pre-train, Fine-tune: models
  1. BERT
    • bidirectional transformer,词语和句子级别的特征抽取,注重文本理解
    • Pre-train: Maked Language Model + Next Sentence Prediction
    • Fine-tune: 根据任务选取对应的representation(最后一层hidden state输出),放入线性层中
      例:Named Entity Recognition
      在这里插入图片描述
Pre-train, Fine-tune: models
  1. GPT
    • auto-regressive model,通过前序文本预测下一词汇,注重文本生成
    • Pre-train: L 1 ( U ) = ∑ i log ⁡ P ( u i ∣ u i − k , … , u i − 1 ; Θ ) L_1(\mathcal{U})=\sum_i \log P\left(u_i \mid u_{i-k}, \ldots, u_{i-1} ; \Theta\right) L1(U)=ilogP(uiuik,,ui1;Θ)
    • Fine-tune: task-specific input transformations + fully-connected layer
      在这里插入图片描述
Pre-train, Fine-tune: challenges
  1. gap between pre-train and fine-tune

少样本学习能力差、容易过拟合

在这里插入图片描述

Pre-train, Fine-tune: challenges
  1. gap between pre-train and fine-tune

少样本学习能力差、容易过拟合
在这里插入图片描述

Pre-train, Fine-tune: challenges
  1. cost of fine-tune

现在的预训练模型参数量越来越大,为了一个特定的任务去 finetuning 一个模型,然后部署于线上业务,也会造成部署资源的极大浪费
在这里插入图片描述

Pre-train, Prompt, Predict: what is prompting

  • fine-tuning: 通过改变模型结构,使模型适配下游任务
  • prompt learning: 模型结构不变,通过重构任务描述,使下游任务适配模型

在这里插入图片描述

Pre-train, Prompt, Predict: workflow of prompting

在这里插入图片描述

Pre-train, Prompt, Predict: workflow of prompting
  1. Template: 根据任务设计prompt模板,其中包含 input slot[X] 和 answer slot [Z],后根据模板在 input slot 中填入输入
  2. Mapping (Verbalizer): 将输出的预测结果映射回label

在这里插入图片描述

Pre-train, Prompt, Predict: prompt design

Prompting 中最主要的两个部分为 template 与 verbalizer 的设计。

他们可以分别基于任务类型和预训练模型选择(shape)或生成方式(huamn effort)进行分类。

在这里插入图片描述

相关推荐

  1. prompt

    2024-01-16 19:48:04       37 阅读
  2. prompt提示

    2024-01-16 19:48:04       48 阅读
  3. Prompt Engineering

    2024-01-16 19:48:04       57 阅读
  4. Prompts(一)

    2024-01-16 19:48:04       42 阅读
  5. Prompts(二)

    2024-01-16 19:48:04       49 阅读
  6. Prompt engineering

    2024-01-16 19:48:04       31 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-16 19:48:04       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-16 19:48:04       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-16 19:48:04       87 阅读
  4. Python语言-面向对象

    2024-01-16 19:48:04       96 阅读

热门阅读

  1. 动态表达式树(Expression Tree)来实现动态筛选

    2024-01-16 19:48:04       56 阅读
  2. 【MySQL】MySQL 专项练习

    2024-01-16 19:48:04       50 阅读
  3. 【精选】samba服务的下载和使用 (超详细)

    2024-01-16 19:48:04       55 阅读
  4. chrome浏览器并发限制及其突破手段

    2024-01-16 19:48:04       45 阅读
  5. Day27- 贪心算法part01

    2024-01-16 19:48:04       51 阅读
  6. 49-定时器,倒计时,清除定时器,延迟器

    2024-01-16 19:48:04       59 阅读
  7. cesiumlab切片通过arcgisjs加载

    2024-01-16 19:48:04       55 阅读
  8. MySQL虚拟列提高检索效率

    2024-01-16 19:48:04       51 阅读