type
Post
status
Published
date
Apr 8, 2023
slug
summary
tags
Ubuntu18.04
nvidia driver
category
学习思考
icon
password
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
问题:服务器显卡驱动突然失效
方案:卸载显卡驱动并重装
sudo apt-get remove --purge nvidia-* -y sudo /usr/bin/nvidia-uninstall sudo apt-get --purge remove nvidia-* sudo apt-get purge nvidia* sudo apt-get purge libnvidia* sudo apt autoremove sudo ubuntu-drivers autoinstall sudo reboot
注:autoinstall会自动选择版本
 
卸载一些脏东西(好像没啥影响)
sudo dpkg --list | grep nvidia-* sudo apt-get remove --purge <package-name>

重装Cuda

  1. 卸载cuda
sudo apt-get remove cuda sudo apt autoremove sudo apt-get remove cuda*
  1. 可进入cuda官网选择驱动版本对应安装,一般nvidia-smi上有推荐版本,runfile简单安装。
  1. sh .run文件页面选择时选择continue→accept→只取消勾选driver选项即可。
 

重装Cudnn

  1. cudnn下载网站
  1. cudnn安装
//替换你自己的版本 tar -xvf cudnn-11.3-linux-x64-v8.2.0.53.tgz //根据你具体文件路径修改 sudo cp cuda/include/cudnn*.h /usr/local/cuda/include sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* //到此cuDNN安装完成,验证cuDNN,查看版本 cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
 
 

重装Pytorch

pip uninstall torch // 下载地址 https://pytorch.org/get-started/locally/ // 测试pytorch能否成功 import torch // 查看torch是否可以使用显卡,True就代表可以! torch.cuda.is_available()
 
clash使用订阅地址(ubuntu18.04)搭建博客

GuoGuo
GuoGuo
一个普通的干饭人🍚
公告
type
Notice
status
Published
date
Jul 2, 2021
slug
#
summary
本站文章只做技术交流
tags
category
icon
password
本站文章只做技术交流