深度学习环境的配置主要包括了CUDA、cuDNN、Tensorrt,这3个主要是配置电脑的运行环境。跑深度学习框架(例如yolov5)还会需要创建虚拟环境,使用Anaconda配置。下面一一介绍配置。
个人目前配置版本为CUDA11.6,cuDNN8.4.1.50,Tensorrt8.4.1.5。
一、CUDA安装
1、查询电脑支持的CUDA版本
一般情况电脑的NVIDIA显卡都会自带显卡驱动程序,使用Win+R——输入cmd进入——输入nvidia-smi可以查看电脑支持的CUDA最大版本。
如图所示电脑可以安装的CUDA最大版本为12.2,如果这里显示的版本很小,说明你的显卡驱动程序很老,需要更新一下。更新驱动比较简单,去官网找自己对应显卡驱动,这里不做介绍。
个人建议CUDA不要安装太新的版本,因为后续的cuDNN、Tensorrt都是对应CUDA版本的,可能会跟不上CUDA的更新,而且深度学习框架也可能适应不了。
2、下载CUDA
Cuda版本的安装网站:CUDA Toolkit Archive | NVIDIA Developer
选择自己需要的版本,点进去,按如下配置选择下载。
3、安装
1、安装cuda时,第一次会让设置临时解压目录,第二次会让设置安装目录;临时解压路径,建议默认即可。安装结束后,临时解压文件夹会自动删除;
2、选择自定义安装
3、 如果是第一次安装尽量全选,否则选第一个,不然会出现错误
4、 不选择visual studio
5、 安装路径可以选择默认,默认一般安装在c盘。
也可以自定义安装目录,如图所示:
6、安装完成后检查系统的环境变量,系统变量有两个路径,是自动生成的。
还有两个,如果没有则手动添加:NVCUDASAMPLES_ROOT、NVCUDASAMPLES11_0_ROOT
4、验证
1、验证是否安装成功, Win+R——输入cmd进入——输入nvcc --version查看版本号。
二、cuDNN安装
1、下载对应CUDA版本cuDNN
1、下载cuDNN包网址为:CUDA Deep Neural Network (cuDNN) | NVIDIA Developer,下载cuDNN包需要登录nvidia账号,根据步骤进行即可。
2、根据自己下载的CUDA版本选择cuDNN下载(11.x代表对11版本通用)。
2、安装
1、 cuDNN实际上是压缩包,下载后进行解压,得到3个文件夹和一个TXT文档。
2、直接把三个文件夹拷贝到cuda的安装目录下。拷贝时看到,CUDA 的安装目录中,有和 cuDNN 解压缩后的同名文件夹,这里注意,不需要担心,直接复制即可。
3、打开系统环境配置,再path中添加以下路径(根据自己的路径进行修改)。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
3、验证
配置完成后,我们可以验证是否配置成功,主要使用CUDA内置的deviceQuery.exe 和 bandwidthTest.exe:首先win+R启动cmd,cd到安装目录下的 …\extras\demo_suite,然后分别执行bandwidthTest.exe和deviceQuery.exe(进到目录后需要直接输“bandwidthTest.exe”和“deviceQuery.exe”),应该得到下图:
至此,CUDA和cuDNN安装完成。
三、Tensorrt安装
1、下载对应CUDA版本Tensorrt
1、首先查看Tensorrt与CUDA对应关系,要Tensorrt支持自己下的CUDA版本。 按如下步骤查看:
2、安装
Tensorrt也是一个压缩包,根据一下步骤将文件分别复制:
将 TensorRT-8.4.1.5\include中头文件 copy 到\CUDA\v11.2\include
将TensorRT-8.4.1.5\lib 中所有lib文件 copy 到\CUDA\v11.2\lib\x64
将TensorRT-8.4.1.5\lib 中所有dll文件copy 到\CUDA\v11.2\bin
然后将TensorRT-8.4.1.5\lib 添加到系统环境变量中D:\TensorRT\TensorRT-8.4.1.5\lib
3、验证
在D:\TensorRT\TensorRT-8.4.1.5\samples中选中sampleMNIST例子,打开sample_mnist.sln右键生成->重新生成直接启动,如果显示如下图则说明安装成功
4、问题
可能出现问题:1、
解决方法为:
可能出现问题:2
解决方法为:
四、虚拟环境搭建
深度学习进行训练、测试都在虚拟环境下进行,一般使用Anaconda进行创建,同时配和PyCharm软件,所以我们先进行软件安装。
1、Anaconda安装
1、Anaconda 官网链接:Anaconda | The Operating System for AI,下载完成后直接安装。
2、安装时,将"Add Anaconda to the system PATH environment variable" 和 “Register Anaconda as the system Python 3.8” 都选上,然后点击安装,等待安装完成即可。其他步骤可以选择默认。
2、PyCharm安装
1、 pycharm windows版本下载地址:https://www.jetbrains.com/pycharm。下载社区版本(日常学习使用够用了),专业版是收费的哦(功能更强大)
2、安装步骤按下图进行,安装路径自定义。
3、配置虚拟环境
1、 在开始界面里打开Anaconda Prompt
2、输入指令创建环境 :conda create -n pytorch python=3.8。pytorch是虚拟环境名字(可以随意设置),3.8 是python版本,都可以按自己需求改,一定要指定具体 python 版本。选择Y等待创建完成。
3、输入指令进入环境conda activate pytorch.
4、安装pytorch环境,去pytorch官网:PyTorch,找到自己想安装的CUDA、torch版本,在pytorch环境下安装。
等待安装完成即可。
5、 若想下载更早的pytorch版本,则点击红色部分:(或直接访问:https://pytorch.org/get-started/previous-versions/),conda和pip都可以安装。
4、检测虚拟环境
1、打开pycharn设置 ,选择刚才我们创建的pytorch环境。
找到自己Anaconda3的文件夹安装路径,然后在envs里面找自己配置的新环境,就是刚才的pytorch,然后选中新环境里的python.exe。
然后点击OK。
2、 点击python控制台
输入import torch然后回车
输入torch.cuda.is_available()结果为True则安装成功。
至此,深度学习的环境搭建完成。CUDA、cuDNN、Tensorrt的版本之间安装时要注意控制。虚拟环境中的CUDA也最好与电脑的CUDA版本一样。虚拟环境里的pyotorch只是初始环境,每一个深度学习框架都还需要配置很多的安装包,这个根据具体情况安装。