1. 安装依赖
sudo apt-get update
sudo apt-get install gcc-12
sudo apt-get install g++-12
sudo apt-get install make
sudo apt-get install cmake
踩坑:ubuntu内核升级到6.5.0需要安装gcc-12,不然会报错
ERROR: The nvidia kernel module was not created.
2. 禁用nouveau
# 验证是否禁用 nouveau
lsmod | grep nouveau
# 若有输出,说明没有禁用,进行以下操作禁用
sudo gedit /etc/modprobe.d/blacklist.conf
# 在文件末尾中添加两条:
blacklist nouveau
options nouveau modeset=0
# 更新配置
sudo update-initramfs -u
# 重启系统
# 查看是否禁用 nouveau,若无输出,则已禁用
lsmod | grep nouveau
3. 查看可用的显卡驱动版本
ubuntu-drivers devices
4. 去英伟达官网下载上面输出的对应版本合适的runfile文件
踩坑:若版本不是推荐版本也会报错
网址 https://developer.nvidia.com/cuda-toolkit-archive/
5. 关闭图形化
sudo init 3
6. 卸载原有驱动
sudo apt-get remove --purge nvidia*
sudo apt-get autoremove
7. 安装CUDA
# 以下的cuda.run换为上面下载的runfile文件名
# 赋权限
sudo chmod a+x cuda.run
# 安装
sudo sh cuda.run
8. 开启图形化
sudo init 5
9. 配置环境变量
gedit ~/.bashrc
在最后加入
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
source ~/.bashrc
10. 检查cuda和显卡驱动是否安装成功
nvidia-smi
nvcc -V
11. 安装CUDNN
官网下载cuda对应版本的cudnn:
https://developer.nvidia.com/rdp/cudnn-archive#a-collapse805-111
解压并进入cudnn目录
sudo cp include/cudnn* /usr/local/cuda/include
sudo cp lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn* /usr/local/cuda/lib64/libcudnn*
12. 检查CUDNN是否安装成功
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2