Machine Vision Technology:Lecture10 Object Detection

计算机视觉(本科) 北京邮电大学 鲁鹏


  • Introduction of object detection
  • Face Detection
  • Pedestrian Detection

object detection and challenges

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Object Detection Design challenges:

  • How to efficiently search for likely objects

    • Even simple models require searching hundreds of thousands of positions and scales.即使是简单的模型也需要搜索成千上万的位置和尺度。
  • Feature design and scoring 特征设计和评分

    • How should appearance be modeled?
    • What features correspond to the object?
  • How to deal with different viewpoints? 处理不同的视角差异

    • Often train different models for a few different viewpoints 经常为几个不同的视角训练不同的模型

Face Detection人脸检测

在这里插入图片描述

Challenges of face detection:

  • Sliding window = tens of thousands of location/scale evaluations

    • 一个百万像素的图像有大约 1 0 6 10^6 106 个像素,以及相当数量的候选人脸位置
  • Faces are rare: 0–10 per image 人脸罕见:每张图片0-10哥人脸

    • For computational efficiency, spend as little time as possible on the non-face windows. 为了提高计算效率,在非人脸窗口上花费尽可能少的时间。
    • For 1 Mpix, to avoid having a false positive in every image, our false positive rate has to be less than 1 0 − 6 10^{-6} 106 1Mpix,避免假阳性在每一个图像,我们的假阳性率必须小于 1 0 − 6 10^{-6} 106

Sliding Window Face Detection with Viola-Jones 2001

Viola-Jones使用了机器学习的boosting算法,下面是boosting算法介绍:

  • A simple algorithm for learning robust classifiers
  • Provides efficient algorithm for sparse visual feature selection
  • Easy to implement, not requires external optimization tools

1.找到正确率大于0.5的分类器 h i ( x ) h_i(x) hi(x)

2.把错误分类的权重放大

3.迭代1-2

通过几个分类器组合起来得到最终分类器。
h ( x ) = α 1 h 1 ( x ) + α 2 h 2 ( x ) + α 3 h 3 ( x ) + ⋯ h(x) = \alpha_1 h_1(x) + \alpha_2 h_2(x) + \alpha_3 h_3(x) + \cdots h(x)=α1h1(x)+α2h2(x)+α3h3(x)+
其中 h ( x ) h(x) h(x) 是 Strong classifier 强分类器, h i ( x ) h_i(x) hi(x) 是Weak classifier, x x x 是 Features vector, α i \alpha_i αi 是 Weight。

每个弱分类器:
h j ( x ) = { 1 if f j ( x ) > θ j 0 otherwise h_j(x) = \left\{ \begin{array}{rcl} 1 & & \text{if} \quad {f_j(x) \gt \theta_j} \\ 0 & & \text{otherwise} \\ \end{array} \right. hj(x)={10iffj(x)>θjotherwise
其中 f j ( x ) f_j(x) fj(x) 是 value of rectangle feature, θ j \theta_j θj 是threshold。如下图所示。

在这里插入图片描述

所以最终的 strong classfier:
h ( x ) = { 1 ∑ t = 1 T α t h t ( x ) > 1 2 ∑ t = 1 T α t 0 otherwise h(x) = \left\{ \begin{array}{rcl} 1 & & {\sum\limits_{t = 1}^{T} \alpha_t h_t(x) \gt \frac{1}{2} \sum\limits_{t = 1}^{T} \alpha_t } \\ 0 & & \text{otherwise} \\ \end{array} \right. h(x)= 10t=1Tαtht(x)>21t=1Tαtotherwise


Viola & Jones algorithm :

  • A “paradigmatic” method for real‐time object detection 实时目标检测的“范例”方法
  • Training is slow, but detection is very fast
  • Key ideas:
    • Integral images for fast feature evaluation 用于快速特征评估的积分图像(积分图)。
    • Boosting for feature selection
    • Attentional cascade for fast rejection of non‐face windows 注意力级联快速拒绝非人脸窗口。也就是对非人脸窗口处理用时更少。

详情看论文,没听太明白。。。就积分图有点像二维联合分布函数的矩形公式。

Pedestrian Detection行人检测

Histograms of oriented gradients for human detection 2005

HoG Feature.

相关推荐

  1. 面试经典150题(10-13)

    2024-03-25 13:40:03       57 阅读
  2. <span style='color:red;'>10</span> C++<span style='color:red;'>11</span>

    10 C++11

    2024-03-25 13:40:03      23 阅读
  3. 1210号总结

    2024-03-25 13:40:03       60 阅读
  4. DAY 10 | 1047, (20,150)

    2024-03-25 13:40:03       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-25 13:40:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-25 13:40:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-25 13:40:03       82 阅读
  4. Python语言-面向对象

    2024-03-25 13:40:03       91 阅读

热门阅读

  1. es同义词配置规则

    2024-03-25 13:40:03       44 阅读
  2. 天秀基础算法 - 二分查找和二分答案

    2024-03-25 13:40:03       33 阅读
  3. SpringCloud优缺点及适合场景

    2024-03-25 13:40:03       40 阅读
  4. npm 包管理工具:常用命令详解与使用指南

    2024-03-25 13:40:03       35 阅读
  5. kingbaseESV8分区表

    2024-03-25 13:40:03       35 阅读
  6. Github 2024-03-21 开源项目日报 Top10

    2024-03-25 13:40:03       31 阅读
  7. 计算方法(第3版)——学习笔记(一)

    2024-03-25 13:40:03       34 阅读
  8. Python之关键字传参(**kwargs)妙处

    2024-03-25 13:40:03       26 阅读
  9. 说一下你对dom驱动和数据驱动的理解

    2024-03-25 13:40:03       45 阅读
  10. 移位补位(1)

    2024-03-25 13:40:03       42 阅读
  11. 多线程(9)Thread类和Runnable接口

    2024-03-25 13:40:03       42 阅读
  12. 茄子科技前端实习面经

    2024-03-25 13:40:03       45 阅读
  13. 24计算机考研调剂 | 广西科技大学

    2024-03-25 13:40:03       35 阅读
  14. kingbaseESV8常用ksql命令

    2024-03-25 13:40:03       36 阅读