记录使用pytorch训练crnn

工程来源:

https://github.com/WenmuZhou/PytorchOCR?tab=readme-ov-file#train

基本数据准备和配置和paddleOCR是一样的;记录一下使用时遇到的问题。

1.环境

我使用的是:172.31.50.201:5000/algorithm/pytorch-1.11.0-cuda11.3-cudnn8-devel-arcface:v2

然后陆续按照要求安装了库:

#pip install imgaug -i https://pypi.tuna.tsinghua.edu.cn/simple
#pip install pyclipper -i https://pypi.tuna.tsinghua.edu.cn/simple
#pip install lmdb -i https://pypi.tuna.tsinghua.edu.cn/simple
#pip install rapidfuzz -i https://pypi.tuna.tsinghua.edu.cn/simple

2.训练时遇到的问题:训练一开始就NAN,使用小数据集时,acc一直为0:

解决办法是修改了CTCloss初始化:

在class CTCLoss(nn.Module)中

self.loss_func = nn.CTCLoss(blank=0, reduction='none',zero_infinity=True)

遇到问题时给的一些好的参考:

 

[深度学习][pytorch][原创]crnn在高版本pytorch上训练loss为nan解决办法_crnn中train loss: nan-CSDN博客 关于pytorch自带的CTCloss使用时的注意事项_pytorch ctc-CSDN博客

https://zhuanlan.zhihu.com/p/67415439

然后就没有报错了

3.加载预训练模型代码修改

def load_pretrained_params(model, pretrained_model):
    # checkpoint = torch.load(pretrained_model, map_location=torch.device('cpu'))
    # model.load_state_dict(checkpoint['state_dict'], strict=False)
    backbone_dict = model.state_dict()
    pretrained_dict = torch.load(pretrained_model, map_location=torch.device('cpu'))
    pretrained_dict_backbone_ = {}
    for k, v in pretrained_dict['state_dict'].items():
        k_ = k.replace('module.', '')
        if k_ in backbone_dict and backbone_dict[k_].size() == v.size():
            pretrained_dict_backbone_[k_] = v
        else:
            print(k_, backbone_dict[k_].size(), v.size())


    backbone_dict.update(pretrained_dict_backbone_)
    model.load_state_dict(backbone_dict)

 

 

相关推荐

  1. 记录使用pytorch训练crnn

    2024-06-07 18:52:05       25 阅读
  2. 如何使用 PyTorch 训练 LLM

    2024-06-07 18:52:05       58 阅读
  3. pytorch学习--使用m1 进行训练

    2024-06-07 18:52:05       21 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-07 18:52:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-07 18:52:05       100 阅读
  3. 在Django里面运行非项目文件

    2024-06-07 18:52:05       82 阅读
  4. Python语言-面向对象

    2024-06-07 18:52:05       91 阅读

热门阅读

  1. Docker 教程-介绍-2

    2024-06-07 18:52:05       26 阅读
  2. elementary OS 8的新消息

    2024-06-07 18:52:05       33 阅读
  3. Spark任务调度

    2024-06-07 18:52:05       29 阅读
  4. SparkStreaming编程-DStream创建

    2024-06-07 18:52:05       26 阅读
  5. 【AIGC调研系列】chatTTS与GPT-SoVITS的对比优劣势

    2024-06-07 18:52:05       26 阅读
  6. Advantages of high pressure cleaners

    2024-06-07 18:52:05       30 阅读
  7. 六个搜索算法及其python实现

    2024-06-07 18:52:05       32 阅读
  8. 思考、学习、创造、越来越有趣

    2024-06-07 18:52:05       26 阅读