人工智能讲座——深度学习实现行人重识别

目录

一、引言

二、深度学习基本概念

三、损失函数


一、引言

1、在不同的监控检测同一行人,实现行人的监测。

2、文本描述行人特征。根据文本描述寻找行人。

是图像检索问题,检索对象是行人。

标本图像与待查询图像相似度对比,相似度从高到低排名。

怎么找相似度?可以用特征。如目标行人上半身白色,下半身黑色。

或者完善特征,一个穿白色T-shirt短袖,黑色长裤,背红色书包留短发的女人。

所有图像形成特征向量,

训练集与测试集来自同一场景。如都是在冬天同一路口的行人。

挑战:行人近大远小,近图像质量高。

背景不同:有人被车挡住

光照不同:白天黑夜,晴雨天

不同角度:正侧面、有高有低

第一个问题没记下来

域(domain)自适应问题,训练集与测试集在不同的场景之中。

如何经过少量训练,实现精度的大幅提升?

上面四个挑战再加两个穿衣不一样、人种不一样。

无监督行人识别问题,没有准确标记数据。

域泛化行人识别问题

网络多目标跟踪MOT问题

关键:物体检测、人物特征处理、同一人匹配

部分人部分时间被挡住了,实时系统。(要快)

一个人每时每刻的追踪:多目标多摄像头匹配问题。

二、深度学习基本概念

有监督问题(分类、回归)

无监督学习(聚类、数据降维)

人工神经网络:输入层、隐含层、输出层

DNN  CNN 迁移学习

三、损失函数

Cross-entropy loss

Triplet Loss

后面听不懂了,想象不出具体的模型。

Part-based Convolutional Baseline PCB RPP

SPGAN

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-13 01:24:06       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-13 01:24:06       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-13 01:24:06       58 阅读
  4. Python语言-面向对象

    2024-07-13 01:24:06       69 阅读

热门阅读

  1. LeetCode 算法:全排列 c++

    2024-07-13 01:24:06       23 阅读
  2. 云端日历同步大师:iCloud让工作与生活井井有条

    2024-07-13 01:24:06       25 阅读
  3. 简述linux通知链机制

    2024-07-13 01:24:06       24 阅读
  4. 关于如何上传本地文件到Linux主机

    2024-07-13 01:24:06       16 阅读
  5. MySQL——PreparedStatement对象

    2024-07-13 01:24:06       21 阅读
  6. 【小超嵌入式】猜数字游戏详细分析

    2024-07-13 01:24:06       18 阅读
  7. 基于深度学习的文本分类

    2024-07-13 01:24:06       19 阅读
  8. VRRP虚拟路由器协议的基本概述

    2024-07-13 01:24:06       20 阅读
  9. ubuntu服务器部署vue springboot前后端分离项目

    2024-07-13 01:24:06       19 阅读