简单记录配置深度学习环境(Ubuntu+Pytorch)

安装INVIDIA显卡驱动

  • Ubuntu推荐安装
    1、查看ubuntu驱动:ubuntu-drivers devices
    在这里插入图片描述
    2、安装Ubuntu推荐的显卡驱动:sudo apt install nvidia-driver-545
    3、重启机器:reboot
    4、验证安装结果:nvidia-smi
    在这里插入图片描述

  • INVIDIA第三方安装
    1、查看显卡型号:lspci -vnn | grep NVIDIA
    2、去英伟达官网下载相应驱动:英伟达显卡驱动在这里插入图片描述
    3、禁用虚拟机自带的显卡驱动:
    执行:sudo vim /etc/modprobe.d/blacklist.conf
    添加: blacklist nouveauoptions nouveau modeset=0
    更新内核:sudo update -initramfs -u
    4、安装显卡驱动:sh 英伟达显卡驱动.run
    5、重启机器:reboot

  • 需要注意的点
    注意点:一般VMware Workstation创建出来的Ubuntu虚拟机是无法使用主机显卡的,一般的解决方案就是GPU直通和使用VGPU技术,对于这两种解决方案来说,都需要使用VMware vSphere,尤其是使用VGPU的话,还需要去安装VMware的英伟达驱动,很麻烦,据了解还需要有相应的license才最终能实现使用。

安装cuda

  • 获取cude版本
    1、查看最高支持的cuda版本:nvidia-smi
    2、下载cuda:https://developer.nvidia.com/cuda-toolkit-archive
    3、安装cuda:sh cuda安装包.run --override
    4、图像化安装,在最后一步,第一项驱动不选,第二项选上,其他可选。
    5、配置环境变量:sudo vim ~/.brashrc
    添加:export PATH="/usr/local/cuda-11.3/bin:$PATH"
    以及export LD_LIBRARY_PATH="/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH"
    执行:source ~/.bashrc
    5、验证安装:nvcc -V
  • 需要注意的点
    1、注意安装完成以后需要配置环境变量,否则运行不了
    2、版本需要选择正确,否则也会失败
    3、分用户使用的话最好不要装在/root下面

安装anaconda

  1. 下载anacondahttps://www.anaconda.com/download#downloads
  2. 安装anaconda :执行:sh anaconda安装包.run
  3. 需要注意的点:加入用root用户安装的话最好更改安装路径,否则其他普通用户用不了
  4. conda常见的命令
    1、查看当前具有的环境:conda info -e
    2、创建新环境:conda create -n环境名称 python=x.x
    3、进入环境:source activate 环境名称
    4、退出环境:conda deactivate
    5、删除环境:conda remove --name 环境名称 --all
    注意:有时候conda比较慢的时候可能需要更换镜像源

安装pytorch

  1. 下载pytorchhttps://pytorch.org/
  2. 安装pytorch :一般是根据pytorch官网给出的命令去安装,前提最好更换成国内的镜像源
  3. 验证安装结果import torch + print(torch.cuda.is_available());结果为报错,且返回TRUE,说明GPU版本安装成功。(进入python中执行,不是shell命令)
  4. 需要注意的点:更换国内镜像源,根据项目要求的pytorch版本去安装;看清楚是GPU版本还是CPU版本

导出虚拟机

  • 导出步骤
    1、关闭虚拟机
    2、文件导出为OVF文件(文件比较大,一共有四个)
  • 需要注意的点
    导出以后一定要考虑虚拟机的兼容性配置

总结

1、安装这一套环境一定需要注意版本之间的对应关系
2、要注意区分是root安装还是普通用户安装
3、配置环境变量的时候也需要注意是全局的还是所属用户的
4、虚拟机迁移一定要考虑兼容性配置
5、pip换源以及conda换源要考虑备份,如果换源失败还能会退回来
6、创建或者运行项目最好在独立的虚拟环境中,这样迁移环境会比较方便

相关推荐

  1. 深度学习配置环境AllInOne

    2024-01-18 13:10:01       17 阅读
  2. 动手学习深度学习环境配置

    2024-01-18 13:10:01       20 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-18 13:10:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-18 13:10:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-18 13:10:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-18 13:10:01       20 阅读

热门阅读

  1. python list.sort方法和内置函数sorted

    2024-01-18 13:10:01       34 阅读
  2. CTF - Web 干货

    2024-01-18 13:10:01       36 阅读
  3. jquery批量执行任务实时返回状态

    2024-01-18 13:10:01       37 阅读
  4. 006 Golang-channel-practice 并发打印字符串

    2024-01-18 13:10:01       34 阅读
  5. 【Android】ObjectBox Duplicate Class 错误分析

    2024-01-18 13:10:01       35 阅读
  6. WPF中Image控件Source的多种指定方式

    2024-01-18 13:10:01       31 阅读
  7. PHP反序列化漏洞-魔术方法绕过

    2024-01-18 13:10:01       38 阅读