英特尔生态的深度学习科研环境配置-A770为例

之前发过在Intel A770 GPU安装oneAPI的教程,但那个方法是用于WSL上。总所周知,在WSL使用显卡会有性能损失的。而当初买这台机器的时候我不在场,所以我这几天刚好有空把机器给重装成Ubuntu了。本篇不限于安装oneAPI,因为在英特尔的生态之下,oneAPI只是一个基座。

本篇集大成者,为使用英特尔生态的人提供便利。

U盘重装Ubuntu

如果大家也是重装,请大家注意备份资源。

首先从官网或者国内镜像,例如清华源下载最新的LTS,然后准备一个16G左右的U盘,使用Rufus把ISO格式的系统镜像文件制作成可引导的 USB 启动安装盘,启动软件后插入U盘会自动检测,你只需要把引导类型选择为你的ISO镜像位置即可。

当U盘启动安装盘制作完毕后,开始启动!进行BIOS(不知道自己机器是什么的,建议F1-F12,甚至Delete, Insert都按按,点击开机键后就疯狂点,我是没想到这是最麻烦的,我是经过百度查了很多快捷键进入都没有效果,然后我乱点上面的键之后才顺利进入BIOS,最后设置自己U盘为第一选择项[找找Boot选择或者首页,里面是可以鼠标和键盘移动的!!!]。Save启动,记住要保存,不然像我这种乱点进入BIOS的,又一次乱点了。)

关于Ubuntu的安装过程就略了…不是本篇的重点。

硬盘管理

安装之后的Ubuntu只有系统盘被格式化了,而其他盘却还是之前的windows盘,你需要重新挂载和格式化文件系统。

首先使用df -h看看你有什么盘,例如/dev/sda1,然后使用sudo mkfs -t ext4 /dev/sda1进行格式化,如果你在windows进行分区过,所以你会看到/dev/sda1/dev/sda2,这时候你可以使用sudo fdisk /dev/sda进行分区的合并,记得分区要保留1个,别都删完了。

data0提前mkdir好,最后使用mount /dev/sda1 /data0进行挂载

写入文件,以后重启也能自动挂载sudo vim /etc/fstab,写入例如:

/dev/sda1       /data0  ext4    defaults        0       0
/dev/sdb1       /data1  ext4    defaults        0       0

中间的空格,我建议直接按Tab键就行了。

驱动

在一篇文章中[https://www.jianshu.com/p/ae15e1cb6968]介绍了如何安装锐炫独立显卡的驱动程序,但是很奇怪的是,这篇文章上开机之后在About界面,Graphics是llvmpipe,可是我安装的Ubuntu 22.04.4 LTS之后,系统是可以正常显示出Intel A770 GPU的。

我当时也非常害怕,所以我还是按照文档重新安装了,这里我建议不要参考我刚刚发的文章进行安装了,并且我也建议大家别看官网,就看我这篇,因为看文档会有个疑惑点,我是试验出来了,不必根据文档走

加官方源

wget -qO - https://repositories.intel.com/gpu/intel-graphics.key | \
  sudo gpg --dearmor --output /usr/share/keyrings/intel-graphics.gpg
echo "deb [arch=amd64,i386 signed-by=/usr/share/keyrings/intel-graphics.gpg] https://repositories.intel.com/gpu/ubuntu jammy client" | \
  sudo tee /etc/apt/sources.list.d/intel-gpu-jammy.list
sudo apt update

优化桌面( Compute, Media, and Display runtimes)使用以及游戏效果

sudo apt install -y \
  intel-opencl-icd intel-level-zero-gpu level-zero \
  intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 \
  libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri \
  libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers \
  mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo
sudo dpkg --add-architecture i386 
sudo apt update
sudo apt install  -y \
  udev mesa-va-drivers:i386 mesa-common-dev:i386 mesa-vulkan-drivers:i386 \
  libd3dadapter9-mesa-dev:i386 libegl1-mesa:i386 libegl1-mesa-dev:i386 \
  libgbm-dev:i386 libgl1-mesa-glx:i386 libgl1-mesa-dev:i386 \
  libgles2-mesa:i386 libgles2-mesa-dev:i386 libosmesa6:i386 \
  libosmesa6-dev:i386 libwayland-egl1-mesa:i386 libxatracker2:i386 \
  libxatracker-dev:i386 mesa-vdpau-drivers:i386 libva-x11-2:i386

i386 软件包不安装,别想在这里玩帕鲁了!

安装开发包

sudo apt install -y \
  libigc-dev intel-igc-cm libigdfcl-dev libigfxcmrt-dev level-zero-dev

安装dkms和内核头文件

这里官网文档以及上面的文章都要大家安装5.19 通用内核,实际上不用,我的内核是6.5.0-25-generic也能成功。

sudo apt update

sudo apt -y install \
    gawk \
    dkms \
    linux-headers-$(uname -r) \
    libc6-dev

sudo reboot

到这里,驱动都安装完了。

你可以使用下面步骤进行验证。

验证

hwinfo --display

hwinfo.png

xpu-smi

既然英伟达都有nvidia-smi,AMD有rocm-smi,英特尔也有自己的xpu-smi。

sudo apt-get install xpu-smi

oneAPI安装

必须要安装Intel® oneAPI Base Toolkit,可以选择性安装HPC等套件。

  • 可以直接使用APT包进行安装:

    • wget -O- https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB \ | gpg --dearmor | sudo tee /usr/share/keyrings/oneapi-archive-keyring.gpg > /dev/null
      
    • echo "deb [signed-by=/usr/share/keyrings/oneapi-archive-keyring.gpg] https://apt.repos.intel.com/oneapi all main" | sudo tee /etc/apt/sources.list.d/oneAPI.list
      
    • sudo apt update

    • sudo apt install intel-basekit

  • 也可以直接下载安装包,例如:

wget https://registrationcenter-download.intel.com/akdlm/IRC_NAS/163da6e4-56eb-4948-aba3-debcec61c064/l_BaseKit_p_2024.0.1.46_offline.sh

sudo sh ./l_BaseKit_p_2024.0.1.46_offline.sh

安装步骤可以看我以前的文章,但在我安装的时候,在界面检测Ubuntu没有包的时候,我的确安装缺少的包进行更新了,但安装脚本没有检测到,因此只要你真的安装了缺少的部分,直接点下一步。

Miniconda3

这里我就不多介绍了:https://docs.conda.io/en/latest/miniconda.html

记得配置好国内源。(再此提醒:Ubuntu、python、conda国内源都要配置好)

Intel版pytorch

Github地址:https://github.com/intel/intel-extension-for-pytorch

也是有tensorflow的:https://github.com/intel/intel-extension-for-tensorflow

要想在intel生态上使用AI,就要安装intel-extension-for-pytorch了,你可以认为这是官方pytorch的一个插件。

  • python -m pip install torch==2.1.0a0 torchvision==0.16.0a0 torchaudio==2.1.0a0 intel-extension-for-pytorch==2.1.10+xpu --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/cn/
  • 激活oneAPI环境:source /opt/intel/oneapi/setvars.sh,注意我的安装的是全套,还有位置如果你和我不同记得修改!使用pytorch必须安装了dpcpp和oneMKL
  • 最后进行测试:python -c "import torch; import intel_extension_for_pytorch as ipex; print(torch.__version__); print(ipex.__version__); [print(f'[{i}]: {torch.xpu.get_device_properties(i)}') for i in range(torch.xpu.device_count())];"不报错即可。

frp内网穿透

又来引用我之前写过的文章了~

  • https://blog.csdn.net/qq_28356373/article/details/127941404

这样就能使用一台电脑进行开发了!

相关推荐

  1. 使用Docker配置深度学习环境——以diffusers

    2024-03-20 12:16:02       28 阅读
  2. 深度学习配置环境AllInOne

    2024-03-20 12:16:02       35 阅读
  3. 动手学习深度学习环境配置

    2024-03-20 12:16:02       42 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-20 12:16:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-20 12:16:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-20 12:16:02       87 阅读
  4. Python语言-面向对象

    2024-03-20 12:16:02       96 阅读

热门阅读

  1. 一、初始项目服务拆分和远程调用

    2024-03-20 12:16:02       37 阅读
  2. 24.3 分布式综合应用

    2024-03-20 12:16:02       31 阅读
  3. R语言系列6——R语言中的机器学习入门

    2024-03-20 12:16:02       34 阅读
  4. 阿里云2025届春招实习生招聘

    2024-03-20 12:16:02       43 阅读
  5. 阿里云MongoDB 分片集群介绍

    2024-03-20 12:16:02       43 阅读
  6. 基于单片机的霓虹灯控制系统设计

    2024-03-20 12:16:02       41 阅读
  7. 洛谷 P1019 [NOIP2000 提高组] 单词接龙

    2024-03-20 12:16:02       41 阅读
  8. web学习笔记(三十八)

    2024-03-20 12:16:02       41 阅读
  9. 深入剖析Apache Kafka Partition:结构、策略与影响

    2024-03-20 12:16:02       41 阅读
  10. 【力扣】26.删除有序数组中的重复项

    2024-03-20 12:16:02       36 阅读
  11. Web基础与http协议

    2024-03-20 12:16:02       44 阅读