多示例学习 (multi-instance learning, MIL) 学习路线 (归类、重点文章列举、持续更新)

0 要点

说明:本文在于能够让大家能够更加快速地了解MIL这个领域,因此将从以下几个方面重点介绍MIL (这里不详细介绍每一篇文章,只做概述)。

注1:欢迎和我进一步交流,可以加入我建立的QQ群 (2024年1月15日建立,没啥人hhh);
注2:如果给出的文章包含代码,可以点击其名称缩写获取;
注3:承2,如果包含博客讲解,可以点击其全称获取;

1 多示例背景介绍

概述:多示例学习 (MIL) 是一种典型的弱监督学习,其输入的单个样本被称为 (bag),包中包含多个实例 (instance)。在训练阶段,通常只有包的标签可知,而实例的标签不可知或者获取成本极高。因此,概括性的,MIL与传统机器学习的主要区别在于:

  1. 弱监督场景:实例的数量巨大却没有标签,仅通过包标签来预测未知类,甚至预测实例标签是极具挑战性的;
  2. 数据结构:包是多个实例的集合,实例可以是向量、图像、视频等任意结构,因此传统机器学习可以看作是MIL的一种特殊情况;

纵观MIL发展历程,其可以分为几个阶段:

  1. 早期:从Dietterich团队的药物活性预测研究开始,尝试直接使用传统的机器学习方法解决MIL问题;
  2. 发展:尝试MIL问题的转换,通常使用嵌入函数或包相似性度量来将其简化为传统的机器学习问题;
  3. 深度:利用深度学习的强大特征提取及表征能力,直接预测包的标签,这也是目前MIL研究的重点;
  4. 应用:考虑更多背景信息,如视频的时序、医疗图像相邻区块的关联性,以更好地处理实际任务;

2 理论MIL概述

之所以优先介绍传统MIL方法,究其原因为:

  1. 传统MIL方法包含众多实用策略,其思想内核至今仍被前沿的深度MIL方法使用;
  2. 传统方法均可被深度MIL直接或间接复刻,通过对齐首要了解,可以为后续深度MIL方法学习打下基础;

2.1 传统MIL方法

传统MIL方法大致分为三种:

  1. 实例方法:首先预测实例标签,并通过MIL假设计算包标签;
  2. 包方法:设计类似于高斯核的MIL包距离度量,使得 k k kNN和SVM等基于距离矩阵的方法得以施展;
  3. 嵌入方法:将包转换为向量,使得传统机器学习策略生效,这也是目前MIL表征学习的基础;

当然,立足于深度MIL方法的小伙伴只需大致了解这类方法。以下是对一些经典方法的归类:

方法名 团队 期刊/会议 全称 思想 领域
ISK 周志华 KDD‘19 Isolation set-kernel and its application to multi-instance learning 基于孤立核设置集合核和嵌入函数 理论
MILDM 悉尼科技大学 TKDE’18 Multi-instance Learning with discriminative bag mapping 利用辨别性优化嵌入结果 理论
miVLAD 周志华 TNNLS’16 Scalable algorithms for multi-instance learning 基于 k k kMeans聚类的高效MIL算法 理论
miFV 周志华 ICDM’14 Scalable multi-instance learning 混合高斯模型及Fisher核编码包为向量 理论
BAMIL 周志华 Applied Intelligence’09 Multi-instance clustering with applications to multi-instance prediction 利用包距离度量和 k k kMeans聚类获取包嵌入向量 理论

2.2 注意力网络

注意力机制的引入是深度MIL发展史上的一次伟大变革,其以Ilse等人发表的ABMIL和GAMIL为伊始,并深刻影响着后续MIL算法的发展。后续的基于对比学习、介入学习等策略的MIL大都围绕其展开,只是方法的侧重有所不同:

方法名 团队 期刊/会议 全称 思想 领域
IBMIL 上海交通大学 CVPR’23 Interventional bag multi-instance learning on whole-slide pathological images 基于训练模型和 k k kMeans的全局特征提取 WSI
CausalMIL 东南大学 NeurIPS’22 Multi-instance causal representation learning for instance label prediction and out-of-distribution generalization
ZoomMIL IBM 欧洲研究院 ECCV’22 Differentiable zooming for multiple instance learning on whole-slide images 多尺度WSI同时输入 WSI
DSMIL 威斯康星大学 CVPR’21 Dual-stream multiple instance learning network for whole slide image classification with self-supervised contrastive learning 双流架构及自监督对比学习 WSI
TransMIL 清华大学 NeurIPS‘21 TransMIL: Transformer based correlated multiple instance learning for whole slide image classification 基于Transformer的相关型MIL框架 WSI
LAMIL 佛罗里达大学 AAAI’20 Loss-based attention for deep multiple instance learning 额外添加实例损失优化模型且提供理论证明 理论
ABMIL&GAMIL 阿姆斯特丹大学 ICML’18 Attention-based deep multiple instance learning 设计了两种注意力机制来捕捉包中的关键实例 理论

2.3 对比学习

2.4 介入学习

方法名 团队 期刊/会议 全称 思想 领域
IBMIL 上海交通大学 CVPR’23 Interventional bag multi-instance learning on whole-slide pathological images 基于训练模型和 k k kMeans的全局特征提取 WSI

2.5 强化学习

2.6 GAN

3 应用MIL概述

3.1 全幻灯片分类

3.2 视频异常检测

3.3 图像分类

3.4 调制识别

3.4 Benchmark

4 MIL交叉领域

4.1 多示例多标签

4.2 多示例偏标签

4.3 多示例分布外检测

4.4 多示例对抗攻击及防御

4.5 多模态多示例

相关推荐

  1. 【AI】人工智能学习路线笔记汇总(持续更新

    2024-01-20 23:42:02       61 阅读
  2. 学习路径】-AI大数据学习路径整理-持续更新

    2024-01-20 23:42:02       41 阅读
  3. 算法系统学习持续更新

    2024-01-20 23:42:02       57 阅读
  4. TCL学习笔记(持续更新)

    2024-01-20 23:42:02       57 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-20 23:42:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-20 23:42:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-20 23:42:02       87 阅读
  4. Python语言-面向对象

    2024-01-20 23:42:02       96 阅读

热门阅读

  1. 科技创新推动绿色能源革命

    2024-01-20 23:42:02       63 阅读
  2. 开发安全之:Path Manipulation

    2024-01-20 23:42:02       65 阅读
  3. Netty和传统NIO之间的比较

    2024-01-20 23:42:02       56 阅读
  4. git提权

    git提权

    2024-01-20 23:42:02      59 阅读
  5. 力扣labuladong——一刷day95

    2024-01-20 23:42:02       53 阅读
  6. 鸿蒙开发语言ArkTS--Ability中的生命周期

    2024-01-20 23:42:02       74 阅读