面了抖音算法岗,被疯狂拷打。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下:

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球


大家好,最近面试了抖音 NLP 算法岗,八股文我准备的还是比较充分,但手撕代码题,每次问到都特别紧张。

这次面试官人很 Nice,也很有耐心,给了一些引导和思路,虽然多浪费了一下时间,最终还是做出来了。

一面

  1. 聊项目

  2. AUC的两种公式是?你能证明这两种等价的吗?

  3. BERT-CRF中,为什么要加CRF?好处是?

  4. self-attention为什么要用QKV三个矩阵,不用有什么问题?有没有哪个模型的Q和K矩阵是一样的?

  5. reinforce属于on-policy还是off-policy?为什么?

  6. reinforce带上baseline好处是?reinforce的loss写一下?

  7. 策略梯度会推导吗?简单写一下?

  8. 介绍大模型微调的优化方法及其区别

  9. 比较ChatGLM、Llama、qwen等大模型的区别

  10. 比较 Layer Normalization(Tayernormalization)和Batch Normalization的区别

  11. 大模型 langchain 和 Ilamaindex,比较两者的区别

  12. 描述从0到1训练大模型的流程、方法及注意事项

  13. 当前大模型检索存在的问题,以及如何进行RAG(Retrieval-Augmented Generation)优化的方法

代码题

代码题一般别着急写,先跟面试官说下思路,确定了再写

  1. 给定一个无重复整数数组,返回所有可能的排列
Input: [1,2,3]
Output:
[
  [1,2,3],
  [1,3,2],
  [2,1,3],
  [2,3,1],
  [3,1,2],
  [3,2,1]
]
  1. 矩阵置零:给定一个 m * n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0

二面

  1. 介绍项目

  2. 知识蒸馏有哪几种?你觉得哪种效果最好?

  3. nlp 的数据增强方法,主要有哪几种?每一种举个例子?

  4. 分类的损失函数为什么是交叉熵而不是mse?

  5. BERT对输入文本的长度有什么限制,为什么要限制长度呢?

  6. 目前有哪几种注意力机制?

  7. 给出emb_size, max_len, vocab_size, ff_inner_size,num_heads, 12层,求BERT参数量 项目常规问题:项目中印象最深的点,怎么解决的,提升多少

代码题

n 皇后问题,基于基础版进行了升级

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-23 00:28:04       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-23 00:28:04       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-23 00:28:04       45 阅读
  4. Python语言-面向对象

    2024-07-23 00:28:04       55 阅读

热门阅读

  1. 使用 kapt 注解生成依赖注入代码

    2024-07-23 00:28:04       13 阅读
  2. Android GlSurfaceView渲染YUV图形

    2024-07-23 00:28:04       16 阅读
  3. iview中Checkbox组件设置不勾选是0,勾选是1

    2024-07-23 00:28:04       14 阅读
  4. 数学基础 -- 导数伪装的极限之变量替换

    2024-07-23 00:28:04       12 阅读
  5. 2024.7.20-22学习日报

    2024-07-23 00:28:04       10 阅读
  6. Linux-查看dd命令进度

    2024-07-23 00:28:04       15 阅读
  7. 【Android Framewrok】Handler源码解析

    2024-07-23 00:28:04       14 阅读
  8. PCI总线域与处理器域

    2024-07-23 00:28:04       13 阅读
  9. 代码随想录 day 20 二叉树

    2024-07-23 00:28:04       16 阅读
  10. 学懂C语言系列(二):C程序结构

    2024-07-23 00:28:04       18 阅读
  11. StringBuilder类

    2024-07-23 00:28:04       12 阅读
  12. thinkphp6连接kingbase数据库

    2024-07-23 00:28:04       11 阅读