推荐系统|概要03_AB测试

A/B测试

在这里插入图片描述
其中小流量是指对部分的用户先尝试改进的算法模型,而非全部。若为全部,如果算法模型存在问题,可能会导致用户体验差,导致用户流失,而小流量的损失代价相对小。
同时模型中也会存在一些需要人工进行设置的参数。也可以在小流量中先进行确定。
因为会有多个参数可供设置,每一个参数可以拿一群人进行测试。

在这里插入图片描述
在这里插入图片描述

问题

流量不够用

因为推荐链路包括召回、粗排、精排和重排四个阶段,每个阶段都可以尝试新的模型,也可以说每个阶段可以由不同的部门进行负责,而每一个部门都可以提出使用A/B测试的请求(领走一批用户作为测试),所以有可能用户是不够用的。

解决方案——分层实验

在这里插入图片描述
同层
在这里插入图片描述
在这里插入图片描述
互斥,不要同时对同一层的同一批/桶用户施加两种不同的策略,这种实际应该只能算是一种策略——两种策略叠加成一种混合策略。
在这里插入图片描述
不同层正交是指位于用户界面2号桶内的用户将均匀打散到召回阶段的各个桶中以供使用。

Holdout 机制

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-05 16:36:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-05 16:36:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-02-05 16:36:01       87 阅读
  4. Python语言-面向对象

    2024-02-05 16:36:01       96 阅读

热门阅读

  1. 2.3作业

    2.3作业

    2024-02-05 16:36:01      45 阅读
  2. flink实战--flink的job_listener使用解析

    2024-02-05 16:36:01       50 阅读
  3. android tv开发-1,leanback替代品

    2024-02-05 16:36:01       54 阅读
  4. sklearn缺失值处理:SimpleImputer模块 补全缺失值

    2024-02-05 16:36:01       53 阅读
  5. 【Android】获取设备IP的方法

    2024-02-05 16:36:01       55 阅读
  6. 使用freemarker和itextpdf结合,将html转化为pdf

    2024-02-05 16:36:01       52 阅读
  7. vue封装滚动表格

    2024-02-05 16:36:01       52 阅读
  8. 考了二级建造师证书后,有哪些好处呢?

    2024-02-05 16:36:01       54 阅读
  9. 消防安全常识知晓率问卷怎么设计

    2024-02-05 16:36:01       42 阅读
  10. MySQL 的一个入门实例

    2024-02-05 16:36:01       53 阅读
  11. 机器学习本科课程 实验4 支持向量机

    2024-02-05 16:36:01       44 阅读
  12. LC 292. Nim 游戏

    2024-02-05 16:36:01       61 阅读
  13. Linux基础复习

    2024-02-05 16:36:01       51 阅读