Transformers —— 以通俗易懂的方式解释-Part 1

公众号:Halo咯咯,欢迎关注~

本系列主要介绍了为ChatGPT以及许多其他大型语言模型(LLM)提供支持的Transformer神经网络。我们将从基础的Transformer概念开始介绍,尽量避免使用数学和技术细节,使得更多人能够理解这一强大的技术。

Transformers —— 以通俗易懂的方式解释-Part 1


在ChatGPT或其他类似的大型语言模型(LLM)中,当您提出问题后,模型会生成一系列单词作为回答,这个过程可能看起来就像您的朋友通过消息应用程序逐字回复您的消息一样。不过,这里的一个区别是,模型在生成每个单词时都进行了精心的计算和选择,而不是简单地按发送键。

第一阶段:理解您的输入

阶段 1.1:准备——代币化

在人工智能和机器学习领域,处理的是数字数据。所以,首先要把您的问题分解成单词,并把每个单词转换成数字。可以想象成一个庞大的词典,里面每个单词都对应一个数字编号。比如,您问:“如何撰写博客文章?” 这个问题会被分解、转换成一系列数字,以便模型能够理解和处理。

您可能会好奇&

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-30 00:12:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-30 00:12:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-30 00:12:02       87 阅读
  4. Python语言-面向对象

    2024-03-30 00:12:02       96 阅读

热门阅读

  1. 数据链路层(四):数据链路层协议

    2024-03-30 00:12:02       43 阅读
  2. C# 异步与 Unity 协程(实例讲解)

    2024-03-30 00:12:02       43 阅读
  3. math模块篇(五)

    2024-03-30 00:12:02       34 阅读
  4. 回溯算法|77.组合

    2024-03-30 00:12:02       39 阅读
  5. LEETCODE-DAY37

    2024-03-30 00:12:02       34 阅读
  6. ARM_01

    2024-03-30 00:12:02       42 阅读
  7. Yarn 记录

    2024-03-30 00:12:02       43 阅读
  8. 笔记001

    2024-03-30 00:12:02       41 阅读
  9. 队列的实现

    2024-03-30 00:12:02       39 阅读