Administrator
Administrator
发布于 2025-02-08 / 10 阅读

关于升级CUDA 工具包的问题

关于升级CUDA 工具包的问题

最近要升级电脑的cuda版本,但是一阵折腾之后驱动有问题了,总是卸载不干净,然后也无法安装新的,报各种错。后面反复咨询了DeepSeek解决了。

cuda常用命令

首先了解一下关于cuda的一些常用命令:

nvidia-smi

用来显示当前的显卡nvidia-smi驱动的版本,右上角显示的是可以安装的cuda工具包的最高版本,注意是可以安装的最高版本,并不是已经安装好的版本。nvidia-smi有输出只是代码驱动安装成功,cuda工具包是另外的。

nvcc -V

用来显示电脑上安装的cuda工具包的版本,会输出类似下面的结果:

image-caek.png

apt list --installed | grep cuda

显示所有安装过的、cuda开头的包。如果要完全卸载相关的包,但是不知道包名叫什么,可以先查一下。

问题解决

  1. 首先关闭所有的终端,建议直接重启一下即可,然后执行下面命令卸载所有nvidia开头的包

    sudo apt purge --autoremove nvidia-*
    
  2. 安装推荐驱动

    # 安装推荐驱动(或指定版本)
    sudo ubuntu-drivers autoinstall
    
  3. 首先,添加NVIDIA官方的PPA仓库,以确保您能够获取到最新的驱动程序版本:

    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt update
    
  4. 查找最新的NVIDIA驱动程序版本

    ubuntu-drivers devices
    
  5. 安装最新的驱动

    使用 apt命令安装推荐的驱动版本,例如,如果推荐的驱动版本是 nvidia-driver-530,可以运行以下命令来安装:

    sudo apt install nvidia-driver-580
    
  6. 安装完成后,重新启动计算机:

    sudo reboot
    
  7. 更新仓库,并安装最新的cuda工具包(这里的cuda-toolkit-12-5根据实际版本替换)

    sudo apt update
    sudo apt install cuda-toolkit-12-5
    
  8. 配置环境变量
    使用nano或者vim,编辑 ~/.bashrc。(如果使用nano,ctrl+O然后直接回车是保存,ctrl+X是退出)

    sudo nano ~/.bashrc
    

    添加以下行:

    export PATH=/usr/local/cuda-12.5/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib64:$LD_LIBRARY_PATH
    
  9. 应用更改:

    source ~/.bashrc
    
  10. 验证是否安装成功

    nvcc -V    # 应显示 CUDA 12.5
    nvidia-smi # 确认驱动版本支持的 CUDA 版本(12.8)