GRIT论文阅读笔记

在这里插入图片描述

  • 一篇试图统一生成任务和编码任务的工作,就是把只能完成生成任务的GPT改成既能生成又能encode。
  • 思路其实很简单,就是在输入的时候添加instruction tokens来指引模型做representation还是generation,然后各自算损失。representation任务用的是document和query的对比学习。把最后一层的token给mean pooling(只对word tokens做,不对instruction做)出一个embedding算对比损失,做generation的时候就按generation的流程来,思路很简单没什么特别的。
  • 另一点细节是representation的时候是没有mask的,generation的时候才做mask
    在这里插入图片描述

相关推荐

  1. 论文阅读笔记】清单

    2024-06-18 16:58:02       77 阅读
  2. PointMixer论文阅读笔记

    2024-06-18 16:58:02       61 阅读
  3. BERT 论文阅读笔记

    2024-06-18 16:58:02       65 阅读
  4. Transformer 论文阅读笔记

    2024-06-18 16:58:02       59 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-18 16:58:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-18 16:58:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-06-18 16:58:02       87 阅读
  4. Python语言-面向对象

    2024-06-18 16:58:02       96 阅读

热门阅读

  1. 学生成绩管理系统:

    2024-06-18 16:58:02       30 阅读
  2. ffmpeg压缩视频

    2024-06-18 16:58:02       28 阅读
  3. 公有云和私有云有什么区别?详情介绍有关内容

    2024-06-18 16:58:02       29 阅读
  4. OpenGL绘制Bezier曲线

    2024-06-18 16:58:02       33 阅读
  5. Mybatis和Hibernate的作用区别及底层原理分析

    2024-06-18 16:58:02       34 阅读
  6. 李宏毅深度学习项目——HW1个人笔记

    2024-06-18 16:58:02       26 阅读
  7. Linux 常用命令 - rm 【删除文件或目录】

    2024-06-18 16:58:02       35 阅读
  8. 【二维码】

    2024-06-18 16:58:02       32 阅读