人工智能论文:BERT和GPT, GPT-2, GPT-3 的简明对比和主要区别

在BERT的论文里面: 2018.10 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,BERT已经解释了BERT,GPT,ELMo的区别。

*ELMo为双向RNN,请忽略。

主要区别:

  • BERT使用的是transformer的encoder,双向,专注于完形填空。对于缺失的内容和应试内容比较擅长。
  • GPT使用的是transformer的decoder,单向,专注于预测,因为decoder看不到后面的字符,训练GPT的预测性能。
  • BERT和GPT-1都使用了微调,以应对各种考试。而后期GPT-2,GPT-3抛弃微调,专注于通用人工智能。

相关推荐

  1. 人工智能论文GPT, GPT-2, GPT-3 对比演进思路

    2024-04-30 10:06:03       28 阅读
  2. Python R两者主要区别优缺点对比

    2024-04-30 10:06:03       30 阅读
  3. Python 3Python 2之间主要区别

    2024-04-30 10:06:03       28 阅读
  4. Auto tokenizerBert tokenizer区别

    2024-04-30 10:06:03       63 阅读
  5. wordvect嵌入bert嵌入区别

    2024-04-30 10:06:03       39 阅读
  6. VUE2VUE3区别对比一览

    2024-04-30 10:06:03       45 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-30 10:06:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-30 10:06:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-30 10:06:03       82 阅读
  4. Python语言-面向对象

    2024-04-30 10:06:03       91 阅读

热门阅读

  1. Python读MCU串口

    2024-04-30 10:06:03       36 阅读
  2. 如何理解 HTTP 状态码?

    2024-04-30 10:06:03       34 阅读
  3. 能源系统-有功无功科普

    2024-04-30 10:06:03       33 阅读
  4. 数据结构-图

    2024-04-30 10:06:03       31 阅读
  5. openlayers6在uniapp中结合rendjs

    2024-04-30 10:06:03       29 阅读
  6. Go 语言函数

    2024-04-30 10:06:03       31 阅读
  7. Redis八股文

    2024-04-30 10:06:03       35 阅读
  8. React

    2024-04-30 10:06:03       29 阅读
  9. 各种优化器及其优缺点(SGD,RMSProp,Adam及其变种)

    2024-04-30 10:06:03       37 阅读
  10. 机器学习-- 爬虫IntelliScraper 重大更新说明

    2024-04-30 10:06:03       35 阅读
  11. uni-app + vant 实现可搜索的popup

    2024-04-30 10:06:03       33 阅读