目录
1)开启了UEFI secure boot,导致第三方模块没有被合法签名,所以无法校验成功并加载
2)其他安装,导致系统在配置文件中禁用了nvidia-drm 模块不起作用
1. 在官网(CUDA Toolkit Archive | NVIDIA Developer)下载cuda,版本根据自己需求选择即可,但是不要超过显卡支持的最高版本。
2. 然后选择runfile的方式安装(因为只用输入两行命令,懒…)
1. 安装cudnn是通过tar包进行安装的,注意有软链接的问题。不能只cp过去,软链接复制过去就变了。
5. 把lib里的所有文件进行压缩,放到上一层目录下,名字叫lib64.tar
2. 通过上面命令解压之后,会得到一个解压文件TensorRT-8.5.1.7,然后执行如下两条命令:
最近给电脑装了一个Liunx系统,由于电脑采用固态硬盘安装操作系统,机械硬盘存放数据的方式,导致数据盘在安装Ubuntu系统时无法识别机械硬盘的分区信息,因为之前机械硬盘使用动态分区的方式。折腾了好久,最后选择将Ubuntu安装在U盘中的方案,此方案最后成功安装。但遇到一个很大的问题,NVIDIA显卡驱动一直装不上,接下来将解决问题过程记录如下。
1.卸载旧驱动
无论之前是否安装过NVIDIA驱动,都推荐执行这一步骤:
$ sudo apt-get remove --purge nvidia*
# 若安装失败也是这样卸载以及
$ sudo chmod a+x NVIDIA-Linux-x86_64-535.129.03.run
# 给予可执行权限
$ sudo sh NVIDIA-Linux-x86_64-535.129.03.run --uninstall #确保卸载干净。
2. 禁用nouveau驱动
Nouveau是由第三方为NVIDIA显卡开发的一个开源3D驱动,为了让用户安装完系统即可进入桌面,因此很多Linux发行版默认集成了Nouveau驱动。但是Nouveau驱动会影响安装NVIDIA官方驱动,因此在安装前要先禁用Nouveau驱动。
sudo gedit /etc/modprobe.d/blacklist.conf
在文本最后添加
blacklist nouveau
options nouveau modeset=0
完成后,重启电脑
3. 安装最后出现nvidia-drm错误
nable to load the “nvidia-drm” kernel module
ERROR: Installation has failed. Please see the file '/var/log/nvidia-installer.log' for details. You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.
出现这个问题可能有两个原因:
1)开启了UEFI secure boot,导致第三方模块没有被合法签名,所以无法校验成功并加载
解决方法: 执行以下命令:
sudo mokutil --disable-validation
#Ab12345678
该命令会要求设置一个 8-16位的密码,设置完成后重启。第一次重启,会有几秒钟提示按任意键进入MoK管理界面,然后按照提示输入密码,禁用Secure boot 即可。
2)其他安装,导致系统在配置文件中禁用了nvidia-drm 模块不起作用
解决方法: 执行以下命令:
$ grep nvidia /etc/modprobe.d/* /lib/modprobe.d/*
运行结果如下,可能不同机器的结果会有小出入,但可见NVIDIA的一些模块被禁用:
etc/modprobe.d/blacklist-framebuffer.conf:blacklist nvidiafb
/lib/modprobe.d/blacklist-nvidia.conf:# This file was generated by nvidia-prime
/lib/modprobe.d/blacklist-nvidia.conf:blacklist nvidia
/lib/modprobe.d/blacklist-nvidia.conf:blacklist nvidia-drm
/lib/modprobe.d/blacklist-nvidia.conf:blacklist nvidia-modeset
/lib/modprobe.d/blacklist-nvidia.conf:alias nvidia off
/lib/modprobe.d/blacklist-nvidia.conf:alias nvidia-drm off
/lib/modprobe.d/blacklist-nvidia.conf:alias nvidia-modeset off
/lib/modprobe.d/nvidia-kms.conf:# This file was generated by nvidia-prime
/lib/modprobe.d/nvidia-kms.conf:options nvidia-drm modeset=1
因此需要将这些blacklist文件删除或者转为.bak文件(可能不同机器文件名不同,可视上一命令运行结果定)
cd /etc/modprobe.d/
sudo mv blacklist-nvidia.conf blacklist-nvidia.conf.bak
cd /lib/modprobe.d/
sudo mv blacklist-nvidia.conf blacklist-nvidia.conf.bak
上述步骤非常关键!!!
4. 安装Nvidia驱动
执行以下命令
--禁用图形界面
sudo service gdm3 stop
--恢复图像界面
sudo service gdms start
--修改语言
export LANG='UTF-8'
export LANGUAGE='UTF-8'
sudo ./NVIDIA-Linux-x86_64-535.129.03.run -no-opengl-files -no-x-check
1. There appears to already be a driver installed on your system (version:
390.42). As part of installing this driver (version: 390.42), the existing
driver will be uninstalled. Are you sure you want to continue?
Continue installation Abort installation
(选择 Coninue,如果是重装的话)
2. The distributio