LLM大模型从入门到精通(1)--LLM基础知识介绍

1. 大语言模型 (LLM) 背景

2. 语言模型 (Language Model, LM)


1. 大语言模型 (LLM) 背景

        大语言模型 (英文:Large Language Model,缩写LLM) 是一种人工智能模型, 旨在理解和生成人类语言. 大语言模型可以处理多种自然语言任务,如文本分类、问答、翻译、对话等等.

        通常, 大语言模型 (LLM) 是指包含数千亿 (或更多) 参数的语言模型(目前定义参数量超过10B的模型为大语言模型),这些参数是在大量文本数据上训练的,例如模型 GPT-3、ChatGPT、GLM、BLOOM和LLaMA等. 

截止目前,语言模型发展走过了三个阶段:

2. 语言模型 (Language Model, LM)

        语言模型(Language Model)旨在建模词汇序列的生成概率,提升机器的语言智能水平,使机器能够模拟人类说话、写作的模式进行自动文本输出。

        可以分为4类,分别是基于规则和统计的语言模型神经语言模型预训练语言模型大语言模型

 

         从文本生成角度,也可以这样定义语言模型:给定一个短语(一个词组或者一句话)语言模型可以生成(预测)接下来的一个词。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-09 16:50:08       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-09 16:50:08       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-09 16:50:08       45 阅读
  4. Python语言-面向对象

    2024-07-09 16:50:08       55 阅读

热门阅读

  1. 设计模式简单示例

    2024-07-09 16:50:08       24 阅读
  2. CSS里的几个小知识

    2024-07-09 16:50:08       32 阅读
  3. 社交媒体原生应用开发:Facebook的创新之路

    2024-07-09 16:50:08       33 阅读
  4. Gunicorn+Flask+Docker初体验

    2024-07-09 16:50:08       26 阅读
  5. 常用目标检测的格式转换脚本文件txt,json等

    2024-07-09 16:50:08       26 阅读
  6. 信息收集-arping

    2024-07-09 16:50:08       23 阅读
  7. flutter如何实现点击一文字后 打开对应的超链接

    2024-07-09 16:50:08       23 阅读
  8. TCP协议是安全的吗?

    2024-07-09 16:50:08       47 阅读