libcudart.so.10.2: cannot open shared object file: No such file or directory

整体过程

首先出现这个报错说明在/usr/local/cuda-11.5/lib64目录中确实没有libcudart.so.10.2这个文件,然后按照网上的教程,我在虚拟环境中安装了cuda10.2(由于用的是服务器,不用虚拟环境会出现提示有多个显卡驱动:Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing.,然后再安装就提示安装失败),结果又报错ImportError: libcudart.so.12: cannot open shared object file: No such file or directory,意思是还是要下载cuda12.1,最后通过这个帖子解决了问题:https://github.com/vllm-project/vllm/issues/1718

pip -q install --upgrade fschat accelerate autoawq vllm
pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0 torchtext==0.16.0+cpu torchdata==0.7.0 --index-url https://download.pytorch.org/whl/cu121

细节

在虚拟环境中安装cuda 10.2

参考https://blog.csdn.net/Sir666888/article/details/122073675
首先用conda activate virtual_environment_name进入虚拟环境,再安装cuda 10.2:

conda install cudatoolkit=10.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/

到此为止cuda 10.2已经安装好了,下面为记录失败的尝试,可以直接跳过到下一章节~~
中间我还尝试官方的下载命令:
cuda 10.2官方:https://developer.nvidia.com/cuda-10.2-download-archive
cuda历史版本:https://developer.nvidia.com/cuda-toolkit-archive
此处参考教程:https://blog.csdn.net/qq_35082030/article/details/110387800
首先查看系统内核,选择需要的CUDA版本,通过命令cat /proc/version查看当前操作系统版本信息:
在这里插入图片描述
一开始不知道Ubuntu 9.4.0-1ubuntu1~20.04.2是什么意思,后面搜了下9.4.0指的应该是gcc版本(https://ubuntu.pkgs.org/20.04/ubuntu-updates-main-amd64/gcc-9_9.4.0-1ubuntu1~20.04.2_amd64.deb.html),所以我们Ubuntu版本应该为Ubuntu 20.04,因此我是这样选择的:
在这里插入图片描述

将下载好的文件执行以下操作:

  1. 先进入要下载的目录,执行命令:wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
  2. 然后在该目录下,使用chmod 755 cuda_10.2.89_440.33.01_linux.run更改文件的执行权限。
  3. 由于我们不是管理员用户,因此无法使用sudo安装,因此直接执行以下命令即可 sh cuda_10.2.89_440.33.01_linux.run,然后就出现这个页面:
    在这里插入图片描述
    我选择continue后显示失败。

在虚拟环境中安装cuda 12.1

安装好了cuda 10.2后,运行代码又报错了ImportError: libcudart.so.12: cannot open shared object file: No such file or directory,意思是还是要下载cuda12.1,最后通过这个帖子解决了问题:https://github.com/vllm-project/vllm/issues/1718
运行如下命令即可:

pip -q install --upgrade fschat accelerate autoawq vllm
pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0 torchtext==0.16.0+cpu torchdata==0.7.0 --index-url https://download.pytorch.org/whl/cu121

相关推荐

  1. PYTHON 120道题目详解(100-102

    2024-04-30 01:40:02       47 阅读
  2. PYTHON 120道题目详解(106-108

    2024-04-30 01:40:02       38 阅读
  3. LeetCode 12 / 100

    2024-04-30 01:40:02       42 阅读
  4. H12-821_182

    2024-04-30 01:40:02       41 阅读
  5. LeetCode:经典题之102103题解及延伸

    2024-04-30 01:40:02       25 阅读
  6. 面试经典150题(101-104)

    2024-04-30 01:40:02       46 阅读
  7. 安卓kotlin面试题 101-105

    2024-04-30 01:40:02       38 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-30 01:40:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-30 01:40:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-30 01:40:02       87 阅读
  4. Python语言-面向对象

    2024-04-30 01:40:02       96 阅读

热门阅读

  1. docker数据卷

    2024-04-30 01:40:02       32 阅读
  2. 24年第一篇:个人小记

    2024-04-30 01:40:02       32 阅读
  3. 考研数学精选题目016

    2024-04-30 01:40:02       30 阅读
  4. 【题解】NowCoder 除2!

    2024-04-30 01:40:02       29 阅读
  5. 八大元素定位方法

    2024-04-30 01:40:02       33 阅读
  6. ASIM复现相关知识补充

    2024-04-30 01:40:02       32 阅读
  7. LeetCode 刷题 -- Day 6

    2024-04-30 01:40:02       34 阅读
  8. 保护您的连接:无线网络安全探究

    2024-04-30 01:40:02       36 阅读
  9. vue的build先上部署的 devServer不生效的场景记录

    2024-04-30 01:40:02       35 阅读
  10. 乐观锁和悲观锁

    2024-04-30 01:40:02       38 阅读
  11. [SQL系列]从零开始学Clickhouse——集群篇

    2024-04-30 01:40:02       36 阅读