CANN 开发工具介绍

1、ATC工具

ATC(Ascend Tensor Compiler)是异构计 算架构CANN体系下的模型转换工具, 它可 以将开源框架的网络模型以及Ascend IR定义 的单算子描述文件(json格式)转换为昇腾 AI处理器支持的.om格式离线模型。

2、精度对比工具

精度比对是用于比对自有实现的算子运算结 果与业界标准算子运算结果存在的差异,帮助开发人员快速定位算子精度问题的工具。

● 推理场景中,ATC在模型转换过程中对模 型进行了优化,包括算子消除、算子融 合、算子拆分,可能会造成算子精度问 题。

● 训练场景中,用户原始网络可以迁移到 Atlas 训练系列产品上执行训练,网络迁移可能会造成算子精度问题。

3、AOE工具

AOE(Ascend Optimize Engine)是一款自动调优工具,作用是充分利用有限的硬件资源,以满足算子和整网的性能要求。 AOE通过生成调优策略、编译、在运行环境 上验证的闭环反馈机制,不断迭代出更优的 调优策略,最终得到最佳的调优策略。从而可以更充分利用硬件资源,不断提升网络的性能,达到最优的效果。

4、性能分析工具

性能分析工具是用于分析在训练阶段或运行 在昇腾AI处理器上的App工程各个运行阶段 的关键性能瓶颈,并提出针对性能优化的建 议,最终实现产品的极致性能。

5、分析迁移工具

分析迁移是可以将PyTorch/TensorFlow脚本迁移为迁移至昇腾NPU或MindSpore生态的工具,开发者可做到少量代码修改或零代码完成迁移。同时提供分析工具,帮助用户分析训练脚本的算子、三方库API、亲和库API 和动态shape支持情况。

6、算子及模型速查工具

算子和模型速查工具提供了查询当前版本 CANN支持的模型和算子功能。

7、专家系统工具

专家系统(Advisor)是用于聚焦模型和算子的性能调优Top问题,识别性能瓶颈,重点构建模型和算子瓶颈分析并提供优化推荐, 支撑开发效率提升的工具。

8、ModelSlim工具

ModelSlim,即昇腾模型压缩加速工具,一 个以加速为目标、压缩为技术、昇腾为根本的亲和压缩工具。支持训练加速和推理加速两大场景,包括模型低秩分解、稀疏训练、训练后量化、量化感知训练等功能。

10、模型压缩工具AMCT

AMCT工具(Ascend Model Compression Toolkit),即AMCT。是一个针对昇腾芯片亲和的深度学习模型压缩工具包,提供量化、稀疏等多种模型压缩特性,压缩后模型 体积变小,部署到昇腾AI处理器上后可使能 低比特运算,提高计算效率,达到性能提升 的目标。

11、性能测试工具HCCL

介绍分布式训练场景下,通过HCCL性能测试 工具测试HCCL集合通信的性能以及功能正确性。

相关推荐

  1. CAN测试工具

    2024-04-23 17:04:05       33 阅读
  2. 【车载开发系列】汽车嵌入式开发常用工具介绍

    2024-04-23 17:04:05       57 阅读
  3. 开源Excel 处理工具库MyExcel介绍以及简单例子

    2024-04-23 17:04:05       45 阅读
  4. 开源IT自动化运维工具Ansible Playbook介绍

    2024-04-23 17:04:05       38 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-23 17:04:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-23 17:04:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-23 17:04:05       87 阅读
  4. Python语言-面向对象

    2024-04-23 17:04:05       96 阅读

热门阅读

  1. 高速公路防逃费智能合约案例

    2024-04-23 17:04:05       27 阅读
  2. 【无标题】数字孪生和可视化区别

    2024-04-23 17:04:05       38 阅读
  3. 企业增长的催化剂—《行列视》

    2024-04-23 17:04:05       39 阅读
  4. 可穿戴个人漂浮设备CE认证(EU) 2016/425指令

    2024-04-23 17:04:05       34 阅读
  5. Python中pop()函数用法

    2024-04-23 17:04:05       36 阅读
  6. 服务器清理挖矿问题

    2024-04-23 17:04:05       33 阅读
  7. 蚁狮优化算法(ALO算法)学习

    2024-04-23 17:04:05       35 阅读
  8. MySQL创建帐号和权限设定

    2024-04-23 17:04:05       28 阅读
  9. 【设计模式】10、composite 组合模式

    2024-04-23 17:04:05       36 阅读
  10. 【华为OD机试】跳马【C卷|200分】

    2024-04-23 17:04:05       33 阅读