Bootstrap

Linux下查看和监控GPU 信息的工具汇总

GPU信息查看

要获取显卡信息,只有两种可能,一种是通过系统的API访问,或者直接读取/dev/下相关文件的状态,另一种方式是通过BIOS读取。

1. 通过PCI查看
通用的方法,通过lspci查看:

lspci | grep -i vga

在这里插入图片描述
前边的序号 "00:0f.0"是显卡的代号,然后

lspci -v -s 00:0f.0

在这里插入图片描述

其他方法:
监控程序glances与其GPU monitoring plug-in一起使用:

开源

安装:sudo apt-get install -y python-pip; sudo pip install glances[gpu]

发布:sudo glances

使用conky作为CPU和GPU的real-time监视器。

英特尔i7-6700HQ iGPU HD 530

在这种情况下,我使用集成GPU而不是nVidia GTX 970M启动:

conky代码根据使用prime-select intel或prime-select nvidia启动进行调整

AMD显卡查看软件

amd显卡有工具,执行atigetsysteminfo.sh
fglrx(闭源驱动程序):aticonfig --odgc --odgt
mesa(开源驱动程序):RadeonTop:apt install radeontop
rocm-smi 显示设备及显存占用,等价于 rocm-svm --alldevice
显示独立内存占用:
rocm-smi --showmeminfo vram vis_vram gtt
显示占用GPU的进程id
rocm-smi --showpids
类似jupyter之类的占用大量显存不释放

NVIDIA显卡查看软件

查看GPU(多卡)的温度

  • nvidia-smi -q -i 0,1 -d TEMPERATURE -i后面的数字表示我的两块GPU
  • gpustat:(nvidia-smi的包装器)
  • Nvidia自带了一个nvidia-smi的命令行工具,用apt安装即可。

用watch命令来监控:
$ watch [options] command
参数 -n 后面指定是每多少秒来执行一次命令。
$ watch -n 10 xxxx
每 10s 执行一次xxxx命令

INTEL显卡查看

intel-gpu-tools工具安装完毕后, 系统中会多种三个gpu工具: intel_gpu_abrt intel_gpu_time intel_gpu_top。
其中,常用的是intel_gpu_top和intel_gpu_time

;