Repetition Improves Language Model Embeddings论文阅读笔记

在这里插入图片描述

  • 文章提出了一种提高decoder-only LLM的embedding能力的方法,叫echo embeddings
  • last-token pooling(即直接选最后一个token作为句子的embedding)和直接mean pooling都不如文章提出的echo embedding,做法是把句子重复两次,然后取第二次的token是的mean pooling。mean pooling的缺点是太强调句子的前面部分,last-token pooling是太强调句子的后面部分,而重复两次后,第二次的句子的起始token也包含了完整句子的语义,从而不会出现直接mean pooling的问题。
  • 另外一点是,输入要添加一些instruction以鼓励第二次的句子编码包含完整句子信息,如下:
    在这里插入图片描述

相关推荐

  1. 论文阅读笔记】清单

    2024-06-19 08:06:03       76 阅读
  2. PointMixer论文阅读笔记

    2024-06-19 08:06:03       60 阅读
  3. BERT 论文阅读笔记

    2024-06-19 08:06:03       65 阅读
  4. Transformer 论文阅读笔记

    2024-06-19 08:06:03       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-19 08:06:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-19 08:06:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-06-19 08:06:03       82 阅读
  4. Python语言-面向对象

    2024-06-19 08:06:03       91 阅读

热门阅读

  1. 虚设备与Spooling技术

    2024-06-19 08:06:03       29 阅读
  2. 【100个C++面试题和解答】

    2024-06-19 08:06:03       36 阅读
  3. 数据结构——顺序表的实现

    2024-06-19 08:06:03       31 阅读
  4. 「前端+鸿蒙」鸿蒙应用开发-布局

    2024-06-19 08:06:03       35 阅读
  5. 拥抱未来:探索改变游戏规则的新存储技术

    2024-06-19 08:06:03       37 阅读
  6. LLM大语言模型(GPT)的分布式预训练与微调及部署

    2024-06-19 08:06:03       36 阅读
  7. 创建最基本的web服务器-http模块

    2024-06-19 08:06:03       34 阅读
  8. cpp混淆详解

    2024-06-19 08:06:03       37 阅读
  9. ListMapToExcel

    2024-06-19 08:06:03       31 阅读
  10. 相机的标定

    2024-06-19 08:06:03       26 阅读
  11. ArcGIS Pro SDK (四)框架 1

    2024-06-19 08:06:03       36 阅读