卷积神经网络学习问题总结

问题一: 深度学习中的损失函数和应用场景

回归任务:

均方误差函数(MSE)适用于回归任务,如预测房价、预测股票价格等。

import torch.nn as nn  
loss_fn = nn.MSELoss()  

分类任务:

交叉熵损失函数(Cross-Entropy Loss)适用于分类任务,如图像分类、文本分类等。对于多分类问题,该损失函数可与Softmax激活函数结合使用。

import torch.nn as nn  
loss_fn = nn.CrossEntropyLoss()  

二分类任务:

二元交叉熵损失函数(Binary Cross-Entropy Loss)适用于二分类问题,如预测是否为垃圾邮件、预测股票涨跌等。对于二分类问题,该损失函数可与Sigmoid激活函数结合使用。

import torch.nn as nn  
loss_fn = nn.BCELoss() 

问题二: 空洞卷积

灰色部分为卷积核权重

白色部分为空,值为0 

dilation rate:空洞率

权重值的间隔为dilation rate - 1

例:m = 3, p = 0, s = 1时

(m表示卷积核大小,p 表示零填充大小(zero-padding), s 表示步长(stride),d表示空洞率(dilation))

若d=1: 

 

若d=2:

优点:在不增加参数的情况下增大感受野,适用于图片size较大,或需要快速感受全局信息的情况。

通过设置不同的dilation rate捕获多尺度上下文信息,适用于需要捕获图片的多层次的情况,如语义分割等。

问题:存在网格效应,远距离点之间的信息可能不相关。

解决办法:HDC

一、叠加卷积的 dilation rate 不能有大于1的公约数。如 [2, 4, 6] 则不是一个好的三层卷积,依然会出现 gridding effect。解决网格效应

二、将 dilation rate 设计成锯齿状结构,例如 [1, 2, 5, 1, 2, 5] 循环结构。同时捕获远近信息

三、满足:

 最常用:

问题三: 残差网络 

反向传播路径太长,训练难度增加

 

问题:

若卷积后的结果与输入X的shape不同, 则不能直接相加
当步长不为1,图片大小发生变化
当通道数与输入通道不同,图片通道数 发生变化

解决:

使用一个1x1的卷积核来改变X的shape,使得其能与卷积后的结果shape相匹配(不知道^ ^

残差模型VS等深卷积:

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-18 04:10:03       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-18 04:10:03       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-18 04:10:03       57 阅读
  4. Python语言-面向对象

    2024-07-18 04:10:03       68 阅读

热门阅读

  1. 从入门到高手的99个python案例

    2024-07-18 04:10:03       18 阅读
  2. Springboot Excel 导出工具 -- EasyPoi 简介

    2024-07-18 04:10:03       22 阅读
  3. 智能家居的优缺点有哪些?

    2024-07-18 04:10:03       17 阅读
  4. RedisServer解析(一)

    2024-07-18 04:10:03       24 阅读
  5. 【算法模板】数论:杨辉三角求组合数

    2024-07-18 04:10:03       23 阅读
  6. 【算法】位运算

    2024-07-18 04:10:03       21 阅读