LLM学习笔记-2

2024-04-22 18:08:03
开发
13

在未标记数据上进行预训练

本章概要
在上节的笔记中，因为训练出的效果，并不是特别理想，在本节中，会用数据进行训练，使得模型更加的好；
计算文本生成损失

inputs = torch.tensor([[16833, 3626, 6100],   # ["every effort moves",
                       [40,    1107, 588]])   #  "I really like"]

targets = torch.tensor([[3626, 6100, 345  ],  # [" effort moves you",
                        [588,  428,  11311]]) #  " really like chocolate"]

假设我们有一个inputs张量，包含了2个训练样本（行）的标记ID。，以下改图，进行阐释了此词汇表的产生
在这里插入图片描述

在数学优化中，最大化概率分数的对数比分数值本身更容易，这里介绍一个回归损失函数Youtube

在这里插入图片描述
其中10.7722称为交叉熵损失。

训练阶段(代码整理完后更新)
训练结果
这次效果比上一节的效果好了很多。有很大的进步。

原文地址:https://blog.csdn.net/weixin_49977305/article/details/138016288 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1782350644590546944.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

LLM学习笔记-2

2024-04-22 18:08:03 14 阅读
LLM学习笔记-3

2024-04-22 18:08:03 12 阅读
LLM学习笔记-4

2024-04-22 18:08:03 12 阅读
LLM学习笔记-5

2024-04-22 18:08:03 13 阅读
LLM学习笔记-6

2024-04-22 18:08:03 9 阅读
LLM设计原理学习笔记

2024-04-22 18:08:03 34 阅读
LLVM学习笔记（64)

2024-04-22 18:08:03 26 阅读
LLVM TableGen 系统学习笔记

2024-04-22 18:08:03 23 阅读
LMDeploy 量化部署 LLM-VLM 实践学习笔记

2024-04-22 18:08:03 12 阅读
Linux学习笔记2

2024-04-22 18:08:03 41 阅读

热门阅读

CSS3 动画

2024-04-22 18:08:03 14 阅读
【AI开发：语言】二、Qwen1.5-7B模型本地部署CPU和GPU版

2024-04-22 18:08:03 12 阅读
在react配置使用less的最优解

2024-04-22 18:08:03 15 阅读
Redis中的Lua脚本(三)

2024-04-22 18:08:03 13 阅读
git 命令大全（常用）

2024-04-22 18:08:03 16 阅读
《大话西游2》本人收集的十二个单机版游戏，有详细的视频架设教程，云盘下载

2024-04-22 18:08:03 12 阅读
Redis中的Lua脚本(二)

2024-04-22 18:08:03 14 阅读
The Greedy Approach

2024-04-22 18:08:03 15 阅读
Python 将PowerPoint (PPT/PPTX) 转为HTML格式

2024-04-22 18:08:03 18 阅读
4.点云数据的配准

2024-04-22 18:08:03 11 阅读
散列表试题解析

2024-04-22 18:08:03 12 阅读
独孤思维：副业借势，无往不利

2024-04-22 18:08:03 16 阅读
刘月红女士：医药行业三十年砥砺前行，助力斐尔玫瑰妇科诊所共创辉煌

2024-04-22 18:08:03 15 阅读
宝塔面板使用docker+nginx+gunicorn部署Django项目实战教程

2024-04-22 18:08:03 13 阅读
Hidl 学习总结 3

2024-04-22 18:08:03 12 阅读
Jmeter v5.6.x 使用说明书（简要版）

2024-04-22 18:08:03 11 阅读
G口服务器的作用是什么？

2024-04-22 18:08:03 13 阅读
【C语言】冒泡排序算法详解

2024-04-22 18:08:03 12 阅读
计算机服务器中了locked勒索病毒怎么办，locked勒索病毒解密工具流程步骤

2024-04-22 18:08:03 10 阅读
『FPGA通信接口』串行通信接口-SPI

2024-04-22 18:08:03 14 阅读
PDF文档电子签名怎么做？

2024-04-22 18:08:03 12 阅读
什么是线程？线程和进程谁更弔？

2024-04-22 18:08:03 15 阅读
每天学习一个Linux命令之chown

2024-04-22 18:08:03 15 阅读
开源项目｜使用go语言搭建高效的环信 IM Rest接口（附源码）

2024-04-22 18:08:03 10 阅读
常见的领域驱动设计架构

2024-04-22 18:08:03 15 阅读
SRE职能描述以及个人见解

2024-04-22 18:08:03 14 阅读
Go 编译构建的一些细节

2024-04-22 18:08:03 10 阅读
力扣【剑指offer】二维数组中的查找

2024-04-22 18:08:03 12 阅读
cannot import name ‘cross_validation’ from ‘sklearn’

2024-04-22 18:08:03 15 阅读
sklearn【AUC-ROC】原理，以及绘制ROC曲线！

2024-04-22 18:08:03 13 阅读