练习5-丢弃法(包含部分丢弃法理解)

util为练习3的解决办法导致的,如果d2l可以正常执行,可无视

代码简解

import torch
from torch import nn
import util as d2l


### 定义模型参数与数据
num_epochs, lr, batch_size = 10, 0.5, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
dropout1, dropout2 = 0.2, 0.5


### 定义模型
net=nn.Sequential(nn.Flatten(),nn.Linear(784,256),nn.ReLU(),
                  nn.Dropout(dropout1),nn.Linear(256,256),nn.Dropout(dropout2)
                  ,nn.Linear(256,10))

### 初始化权重与参数
def init_weights(m):
    if type(m)==nn.Linear:
        nn.init.normal_(m.weight,std=0.01)

net.apply(init_weights);

### 定义损失函数
loss = nn.CrossEntropyLoss(reduction='none')
### 训练模型

trainer=torch.optim.SGD(net.parameters(),lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

陌生代码

net=nn.Sequential(nn.Flatten(),nn.Linear(784,256),nn.ReLU(),
nn.Dropout(dropout1),nn.Linear(256,256),nn.Dropout(dropout2)
,nn.Linear(256,10))

丢弃法理解

丢弃法目的是:
通过减少数据量,来减少过拟合

怎么减少数据量:
通过为每层的输入设置概率即第一层 dropout设置为0.2,第一层的输入的每个数据有0.2的概率被丢弃,0.8的概率正常使用

为什么在多层设置dropout:
因为不同层的w对数据的要求是不一样的,也许上一层不在过拟合,但下一层仍旧过拟合

相关推荐

  1. 练习5-丢弃(包含部分丢弃理解)

    2024-03-23 19:38:02       18 阅读
  2. 数组练习之:二分查找

    2024-03-23 19:38:02       35 阅读
  3. 5W2H

    2024-03-23 19:38:02       8 阅读
  4. Hash算、MD5、HashMap

    2024-03-23 19:38:02       10 阅读
  5. 【Qt5】QList的用

    2024-03-23 19:38:02       43 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-03-23 19:38:02       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-23 19:38:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-23 19:38:02       20 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-23 19:38:02       20 阅读

热门阅读

  1. C++ 小玉在游泳

    2024-03-23 19:38:02       15 阅读
  2. Python学习笔记03

    2024-03-23 19:38:02       17 阅读
  3. 一个简单的前端微服务部署--qiankun

    2024-03-23 19:38:02       14 阅读
  4. php 写入变量时候注意事项会把\\ 写成一个\

    2024-03-23 19:38:02       38 阅读
  5. docker离线安装并修改存储目录

    2024-03-23 19:38:02       17 阅读
  6. exiftool对视频信息进行读取修改

    2024-03-23 19:38:02       17 阅读
  7. HTML

    HTML

    2024-03-23 19:38:02      18 阅读
  8. 【学习记录】CLINS配置与运行

    2024-03-23 19:38:02       25 阅读
  9. 每日一题 第二十四期 洛谷 分数线的划定

    2024-03-23 19:38:02       20 阅读
  10. docker学习笔记 二-----docker介绍

    2024-03-23 19:38:02       23 阅读
  11. AAPT: error: resource android:attr/dialogCornerRadius not found.

    2024-03-23 19:38:02       16 阅读
  12. 组件注意点

    2024-03-23 19:38:02       16 阅读
  13. 数据科学和机器学习技术避坑指南

    2024-03-23 19:38:02       20 阅读