Few-Shot, Zero-Shot & One-shot

先解释 one-shot。公司门禁用了人脸识别,你只提供一张照片,门禁就能认识各个角度的你,这就是 one-shot。可以把 one-shot 理解为用 1 条数据 finetune 模型。在人脸识别场景里,one-shot 很常见。

zero-shot 与 few-shot,回到 NLP 场景。用 wikipedia、新闻等,训练一个 GPT 模型,直接拿来做对话任务,这个就是 zero-shot。然后,发现胡说八道有点多,找了一些人标注了少量优质数据喂进去,这就是 few-shot。

chatGPT 的发展史,就是从 zero-shot 到 few-shot。(摘自沐神的 paper reading 系列)

背景。GPT-3 之前,跟 Bert 是两条路线的竞争关系。
GPT-2 是 zero-shot。效果没有超过 bert,又想发 paper,就把自己的卖点定义为 zero-shot(方法创新),即完全的无监督学习,论文的题目:Language Models are Unsupervised Multitask Learners。
GPT-3 是 few-shot。效果比 bert 好,不用找学术方法的卖点了,而且,zero-shot 做产品的性价比确实不高,换成了 few-shot,也就是找了一些人做标注。论文的题目:Language Models are Few-Shot Learners。
chatGPT 是 HFRL。GPT-3 之后的问题是:few-shot 时到底 shot 啥(标注哪些数据)?他们跟强化学习结合起来,也就是 human feedback reenforcement learning,俗称 HFRL。也就是 chatGPT 的核心技术。
HRFL 这套方法,本质目的是:如何把机器的知识与人的知识对齐。然后开创了一个新的方向,叫 alignment。openAI 在内的好多大佬,都在追这个新方向。

注:这里的 alignment,与人脸识别里的 alignment,完全不一样。

来源:
Few-Shot, Zero-Shot & One-shot 的通俗理解 - JackonYang的文章 - 知乎
https://zhuanlan.zhihu.com/p/624793654

相关推荐

  1. Few-Shot, Zero-Shot & One-shot

    2024-04-21 07:22:04       16 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-21 07:22:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-21 07:22:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-21 07:22:04       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-21 07:22:04       20 阅读

热门阅读

  1. 腾讯云免费ssl证书申请与宝塔手动部署

    2024-04-21 07:22:04       13 阅读
  2. 【Python基础】Lambda匿名函数

    2024-04-21 07:22:04       17 阅读
  3. 开发语言漫谈-React

    2024-04-21 07:22:04       17 阅读
  4. 常用数据结构及设计

    2024-04-21 07:22:04       13 阅读
  5. 开发语言漫谈-脚本语言

    2024-04-21 07:22:04       13 阅读