Bootstrap

Python的图像库(Opencv、PIL、matplotlib、skimage)的使用(读取、存储、变换、滤波),及其差异

Python的图像库(Opencv、PIL、matplotlib、skimage)的使用(读取、存储、变换、滤波)

【AI基础】OpenCV,PIL,Skimage你pick谁

PIL.Image和OpenCV图像格式相互转换

OpenCV,PIL,Skimage差异:

读取方式上的不同

我们首先从读取图片开始,PIL用open方法来读取图片,但opencv、skimage都以imread()读取图片。

RGB与BGR的区别

(1)opencv读进来的图片已经是一个numpy矩阵了,彩色图片维度是(高度,宽度,通道数)。数据类型是uint8;
opencV读取的格式:BGR (opencv对于读进来的图片的通道排列是BGR,而不是主流的RGB!谨记!
opencV存储的格式:BGR
(2)PIL的读取和存储格式是RGB
PIL读进来的图像是一个对象,而不是我们所熟知的numpy 矩阵
针对PIL读进来的图像是一个对象,那么如何才能将读进来的图片转为矩阵呢,方法如下:
from PIL import Image
import numpy as np
img1 = Image.open(‘d:/picture/cat.jpg’)
arr = np.array(img1)

(3)skimage的读取和存储格式是RGB
skimage读取一张图像时也是以numpy array形式
skimage有一个巨大的不同是读取灰度图时其图像的矩阵的值被归一化了,注意注意!

通道顺序的不同
  • PIL和Skimage读取图像是HWC格式,- opencv读取图像是也是HWC的格式

CHW更适合CNN:因为网络是一个通道一个通道的对图像做卷积,提取feature,希望在访问同一个channel的像素是连续的,一般存储选用CHW,这样在做CNN的时候,在访问内存的时候就是连续的了,比较方便;

在深度学习的时候,推理的前处理,一般都是将RGB或BGR图像进行转变为CHW的格式;
通常我们用opencv读取图像是HWC的格式,需要转换

img = cv2.imread(001.jpg”)
img_ = img.transpose((2,0,1))

但是,在pytorch中,无需直接转换,只要调用transforms.ToTensor(),会自动将(HxWxC)转化为(CxHxW)

Converts a PIL Image or numpy.ndarray (H x W x C) in the range [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0]

;