算法面试题_字节

问题一:Transfomer矩阵维度分析及MultiHead详解:

细致链接1
细致链接2

问题二:transformer的结构,流程,维度变换,encoder,decoder:

多头维度怎么变化:先在q,k,v的输入端就进行处理,让他们的维度为 embedding_size /nums_head。最后在注意力层的最后拼接。这就是原因:head的数量需被embedding_size整除
注意力:通过Q和K计算得到注意力权重,然后在作用于V得到整个权重和输出
细致链接

问题三:p-tuning,lora,adapter 的细致算法:

p-tuning
lora
adapter

问题四:评测框架的任务有哪些?cblue

问题五:训了哪些模型,dataset的问题

问题六:cv,deepsortv3,yolo的发展史,yolo的backbone

问题七:dataloader和dataset的区别:

ⅰ. dataset就是传统的类,用户根据特点的需求设定特定的类。
https://huggingface.co/docs/datasets/loading
ⅱ. dataloader则接受dataset定义的类进行分批次,分batch以方便后续的训练,推理等操作。
ⅲ. Dataset检索我们的数据集的特征并一次标记一个样本。dataloader在训练模型时,我们通常希望以“小批量”方式传递样本,在每个时期重新整理数据以减少模型过度拟合;这个有个shuffle决定是否在每个epoch之间打乱每个batch。

相关推荐

  1. 常见算法面试题目

    2024-07-12 16:50:01       63 阅读
  2. 算法面试题目

    2024-07-12 16:50:01       130 阅读
  3. 面试-算法

    2024-07-12 16:50:01       53 阅读
  4. 面试题目总结(三)

    2024-07-12 16:50:01       50 阅读
  5. 网络安全面试题目

    2024-07-12 16:50:01       49 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-12 16:50:01       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-12 16:50:01       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-12 16:50:01       57 阅读
  4. Python语言-面向对象

    2024-07-12 16:50:01       68 阅读

热门阅读

  1. CHD安装

    2024-07-12 16:50:01       22 阅读
  2. 开源项目有哪些机遇和挑战?

    2024-07-12 16:50:01       21 阅读
  3. 敏捷项目管理与PMP有什么区别?彻底说明白!

    2024-07-12 16:50:01       26 阅读
  4. MySQL中客户端会话状态的服务器跟踪描述

    2024-07-12 16:50:01       22 阅读
  5. 创建型模式-工厂模式

    2024-07-12 16:50:01       19 阅读
  6. C++多线程读写文件

    2024-07-12 16:50:01       24 阅读
  7. 利用大数据分析股市异常资金

    2024-07-12 16:50:01       21 阅读
  8. PyTorch 2-深度学习-模块

    2024-07-12 16:50:01       21 阅读
  9. 科锐国际2024年OD招聘,技术岗急招

    2024-07-12 16:50:01       22 阅读