Bootstrap

Linux在CUDA11.5+RTX3090+pytorch构建深度学习环境时CUDA版本冲突导致的no kernel image is available for execution问题

pytorch是非常优秀的深度学习包,面向GPU部分封装的非常好,可以便利的将模型传入GPU中,利用GPU进行深度学习。但是笔者在用pytorch进行环境配置时撞了大坑,最终解决发现是之前下载了CUDA10.2版本的pytorch,和系统实际使用的CUDA版本11.5不匹配。以此文记录最终解决和过程中所学到的知识。

首先是笔者GPU的驱动版本,根据下面链接可以选定匹配的CUDA Version,笔者所使用的的笔记本已经为GPU配置好了CUDA和CuDNN驱动,版本为11.5,输入nvidia-smi即可显示具体信息。还没有安装驱动可以自行查找安装对应版本的驱动。

~$ nvidia-smi
Thu Jul 14 21:07:08 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 495.29.05    Driver Version: 495.29.05    CUDA Version: 11.5     |

对显卡安装完CUDA驱动之后,一定要按照链接中所说的下载对应CUDA版本的pytorch。笔者显卡的CUDA版本为11.5,虽然没有直接对应,但是实测CUDA为11.3版本,即1.12.0+cu113的torch即可配置成功。相关的安装命令详见PyTorch官网和下图。如果为10.2CUDA版本,则出现no kernel image is available for execution的报错。

;