知识蒸馏和知识图谱相结合的大模型微调方案

2024-07-16 21:12:01
开发
20

概念介绍

知识蒸馏（Knowledge Distillation）是一种将大模型（教师模型，Teacher Model）的知识传递给小模型（学生模型，Student Model）的技术。目标是通过训练学生模型，使其能够在较低的计算成本下达到接近教师模型的性能。

实现步骤

1. 教师模型和学生模型的选择

教师模型（Teacher Model）：一个结合了知识图谱（KG）结构信息的大型预训练模型，例如基于图神经网络（GNN）的模型。
学生模型（Student Model）：优化后的大规模语言模型（LLM），需要学习教师模型中的知识和推理路径。

2. 数据准备

输入数据：问题和相关的知识图谱子图，包括问题中的实体和关系。
输出数据：教师模型生成的关系路径及其对应的推理结果。

3. 蒸馏过程

阶段一：教师模型推理

使用教师模型在给定的KG子图上进行推理，生成高置信度的关系路径和推理结果。例如，对于问题“Joe Biden的国籍是什么？”，教师模型可以生成路径：

Joe Biden -> born_in -> Scranton -> city_of -> USA

阶段二：学生模型学习

通过优化学生模型，使其在给定相同输入时，生成与教师模型相似的输出。具体而言，通过最小化以下损失函数来训练学生模型：

$L_{\text{distill}} = \alpha L_{\text{hard}} + (1 - \alpha) L_{\text{soft}}$

其中，

$L_{\text{hard}}$ 是学生模型生成的路径与真实路径（ground truth）之间的交叉熵损失。
$L_{\text{soft}}$ 是学生模型输出的软标签（soft targets）与教师模型输出的软标签之间的Kullback-Leibler散度。
$\alpha$ 是平衡这两部分损失的权重系数。

4. 模型优化

通过不断调整学生模型的参数，使其能够在保持较小模型规模的同时，生成准确的推理路径。在训练过程中，结合真实数据和生成数据进行联合训练，以提高模型的泛化能力。

具体应用示例

假设在训练过程中，教师模型生成了多个路径，如：

Joe Biden -> born_in -> Scranton -> city_of -> USA
Joe Biden -> graduate_from -> University of Delaware -> located_in -> USA

学生模型需要学习生成类似的路径，并在推理过程中，能够在知识图谱中找到并验证这些路径的正确性。

结论

通过知识蒸馏技术，可以将知识图谱中的丰富结构信息和复杂推理路径有效传递给大规模语言模型，增强其推理能力和准确性。这在大规模语言模型在实际应用中具有重要的意义，特别是在处理复杂推理任务时。

原文地址:https://blog.csdn.net/weixin_43655282/article/details/140462018 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1813199912372932608.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-07-16 21:12:01 85 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-16 21:12:01 71 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-16 21:12:01 66 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-16 21:12:01 70 阅读
NoSQL之Redis非关系型数据库

2024-07-16 21:12:01 73 阅读
2024.7.22 作业

2024-07-16 21:12:01 73 阅读
GDB调试正在运行的程序

2024-07-16 21:12:01 58 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-16 21:12:01 59 阅读
在Django里面运行非项目文件

2024-07-16 21:12:01 57 阅读
SSD基本架构与工作原理

2024-07-16 21:12:01 63 阅读
在誉天学习完HCIE就业吗？

2024-07-16 21:12:01 70 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-16 21:12:01 60 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-16 21:12:01 64 阅读
go 协程池的实现

2024-07-16 21:12:01 63 阅读
Shell脚本循环语句与函数

2024-07-16 21:12:01 64 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-16 21:12:01 69 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-16 21:12:01 61 阅读
四大引用——强软弱虚

2024-07-16 21:12:01 66 阅读
Python语言-面向对象

2024-07-16 21:12:01 68 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-16 21:12:01 62 阅读
网站安全-CDN篇

2024-07-16 21:12:01 63 阅读

热门阅读

PostgreSQL的学习心得和知识总结（一百四十八）|查看 PostgreSQL 17 中的新内置排序规则提供程序

2024-07-16 21:12:01 19 阅读
C++入门学习——初始化列表

2024-07-16 21:12:01 23 阅读
uni-app开发时自定义导航栏

2024-07-16 21:12:01 22 阅读
新质生产力和新质战斗力如何深度耦合

2024-07-16 21:12:01 19 阅读
vue3前端页面下载excel模版

2024-07-16 21:12:01 16 阅读
[日进斗金系列]用码上飞解决企微开发维修管理系统的需求

2024-07-16 21:12:01 24 阅读
【Python】Arcpy将excel点生成shp文件

2024-07-16 21:12:01 20 阅读
特征映射(机器学习)

2024-07-16 21:12:01 15 阅读
FFmpeg基础教程之windows编译

2024-07-16 21:12:01 22 阅读
Linux批量更改文件后缀名

2024-07-16 21:12:01 19 阅读
Linux学习笔记day01-shell命令、vim编辑器

2024-07-16 21:12:01 19 阅读
oracle重做日志

2024-07-16 21:12:01 19 阅读
android gradle 开发与应用(一) : Gradle基础

2024-07-16 21:12:01 16 阅读
Intellij IDEA 的Plugins加载不出来的解决方法

2024-07-16 21:12:01 23 阅读
ENSP中NAT的相关实验（两个私网，一个公网）

2024-07-16 21:12:01 23 阅读
【推研小灶】从南京大学LAMDA到中科大大数据学院：计算机专业保研心得

2024-07-16 21:12:01 18 阅读
数据库基础学习

2024-07-16 21:12:01 21 阅读
80%项目经理都在用的进度管理方法

2024-07-16 21:12:01 16 阅读
Python学习4---迭代器和生成器的区别

2024-07-16 21:12:01 23 阅读
Linux基本命令（续）

2024-07-16 21:12:01 20 阅读
HTTPS

2024-07-16 21:12:01 18 阅读
Vue3 基础

2024-07-16 21:12:01 21 阅读
基于mcu固件反汇编逆向入门示例-stm32c8t6平台

2024-07-16 21:12:01 19 阅读
星坤Type-B系列连接器：为高速数据传输提供坚实保障！

2024-07-16 21:12:01 22 阅读
redis-缓存三剑客

2024-07-16 21:12:01 14 阅读
PHP多功能投票微信小程序系统源码

2024-07-16 21:12:01 15 阅读
数据类型与结构设计：Rust 语言的深度探索

2024-07-16 21:12:01 19 阅读
[每周一更]-(第105期)：SSL证书过期后引发的DNS缓存问题

2024-07-16 21:12:01 21 阅读
怎样去除视频上的水印和文字，视频水印文本移除教程

2024-07-16 21:12:01 18 阅读
python爬虫豆瓣电影TOP250

2024-07-16 21:12:01 19 阅读