《昇思25天学习打卡营第8天 | mindspore 模型保存与加载用法》

1. 背景:

使用 mindspore 学习神经网络,打卡第8天;

2. 训练的内容:

为了微调(fine-tune)和后续的模型推理与部署,因此需要保存模型的参数,本小结主要训练保存模型。

3. 常见的用法小节:

模型的保存与加载:

  • 保存与加载模型的参数
  • 保存与加载模型的统一的中间结果

3.1 定义网络:

定义网络

import numpy as np
import mindspore
from mindspore import nn
from mindspore import Tensor

def network():
    model = nn.SequentialCell(
                nn.Flatten(),
                nn.Dense(28*28, 512),
                nn.ReLU(),
                nn.Dense(512, 512),
                nn.ReLU(),
                nn.Dense(512, 10))
    return model

3.2 保存与加载模型参数

保存模型参数与加载模型参数

# 保存模型使用save_checkpoint接口,传入网络和指定的保存路径
model = network()
mindspore.save_checkpoint(model, "model.ckpt")

# 要加载模型权重,需要先创建相同模型的实例,然后使用load_checkpoint和load_param_into_net方法加载参数
model = network()
param_dict = mindspore.load_checkpoint("model.ckpt")
param_not_load, _ = mindspore.load_param_into_net(model, param_dict)
print(param_not_load)

3.3 保存与加载模型推理的中间结果

MindSpore 提供了云侧(训练)和端侧(推理)统一的中间表示(Intermediate Representation,IR)。可使用export接口直接将模型保存为MindIR

# MindIR同时保存了Checkpoint和模型结构,
# 因此需要定义输入Tensor来获取输入shape。
model = network()
inputs = Tensor(np.ones([1, 1, 28, 28]).astype(np.float32))
mindspore.export(model, inputs, file_name="model", file_format="MINDIR")

# 已有的MindIR模型可以方便地通过load接口加载,传入nn.GraphCell即可进行推理。# nn.GraphCell 仅支持图模式
mindspore.set_context(mode=mindspore.GRAPH_MODE)
graph = mindspore.load("model.mindir")
model = nn.GraphCell(graph)
outputs = model(inputs)
print(outputs.shape)

4. 相关链接:

  • https://xihe.mindspore.cn/events/mindspore-training-camp
  • https://gitee.com/mindspore/docs/blob/r2.3.0rc2/tutorials/source_zh_cn/beginner/save_load.ipynb

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 19:58:05       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 19:58:05       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 19:58:05       58 阅读
  4. Python语言-面向对象

    2024-07-10 19:58:05       69 阅读

热门阅读

  1. Postgres 与 MapLibre 实时位置共享

    2024-07-10 19:58:05       17 阅读
  2. NestJs实现各种请求与参数解析

    2024-07-10 19:58:05       26 阅读
  3. AHK的对象和类学习心得

    2024-07-10 19:58:05       19 阅读
  4. Spring中常见知识点及使用

    2024-07-10 19:58:05       27 阅读
  5. Uniapp的简要开发流程指南

    2024-07-10 19:58:05       23 阅读
  6. LeetCode //C - 204. Count Primes

    2024-07-10 19:58:05       21 阅读
  7. 【debug】keras使用基础问题

    2024-07-10 19:58:05       18 阅读
  8. Qt 绘图详解

    2024-07-10 19:58:05       23 阅读
  9. MySQL篇七:复合查询

    2024-07-10 19:58:05       26 阅读
  10. [GDOUCTF 2023]Tea writeup

    2024-07-10 19:58:05       27 阅读