Bootstrap

opencv几何变换(python)

几何变换

几何变换是指将一幅图像映射到另外一幅图像内的操作。

缩放

使用函数cv2.resize()实现对图像的缩放

dst = cv2.resize( src, dsize[, fx[, fy[, interpolation]]] )
  • dst代表输出的目标图像,该图像的类型与src相同,其大小为dsize(当该值非零时),或者可以通过src.size()、fx、fy计算得到。

  • src代表需要缩放的原始图像

  • dsize代表输出图像大小。

  • fx代表水平方向的缩放比例。

  • fy代表垂直方向的缩放比例。

    在cv2.resize()函数中,目标图像的大小可以通过“参数dsize”或者“参数fx和fy”二者之一来指定,具体介绍如下。

    情况1:通过参数dsize指定

    如果指定参数dsize的值,则无论是否指定了参数fx和fy的值,都由参数dsize来决定目标图像的大小。

    dsize内第1个参数对应缩放后图像的宽度(width,即列数cols,与参数fx相关),第2个参数对应缩放后图像的高度(height,即行数rows,与参数fy相关)

    指定参数dsize的值时,x方向的缩放大小(参数fx)为:

    (double)dsize.width/src.cols
    

    同时,y方向的缩放大小(参数fy)为:

    (double)dsize.height/src.rows
    

    情况2:通过参数fx和fy指定

    如果参数dsize的值是None,那么目标图像的大小通过参数fx和fy来决定。此时,目标图像的大小为:

    dsize=Size(round(fx*src.cols), round(fy*src.rows)) 
    

    目标图像dst的最终大小和类型是通过src、dsize、fx、fy指定的。

  • interpolation代表插值方式

    image-20220210220303659

    插值是指在对图像进行几何处理时,给无法直接通过映射得到值的像素点赋值。

    目标图像上的该像素点不能对应到原始图像的某个具体位置上,此时也要对这些像素点进行插值 处理,以完成映射。

    • 当缩小图像时,使用区域插值方式(INTER_AREA)能够得到最好的效果;

    • 当放大图像时,使用三次样条插值(INTER_CUBIC)方式和双线性插值(INTER_LINEAR)方式都能够取得较好的效果。

      三次样条插值方式速度较慢,双线性插值方式速度相对较快且效果并不逊色。

例子

使用函数cv2.resize()对一个数组进行简单缩放。

import cv2 
import numpy as np 
img=np.ones([2,4,3], dtype=np.uint8) 
size=img.shape[:2] 
rst=cv2.resize(img, size) 
print("img.shape=\n", img.shape) 
print("img=\n", img) 
print("rst.shape=\n", rst.shape) 
print("rst=\n", rst) 

注意

  • 目标图像的行数是原始图像的列数。
  • 目标图像的列数是原始图像的行数。

函数cv2.resize()内dsize参数与图像shape属性在行、列的顺序上是不一致的

  • 在shape属性中,第1个值对应的是行数,第2个值对应的是列数
  • 在dsize参数中,第1个值对应的是列数,第2个值对应的是行数

在使用cv2.resize()函数时,要额外注意参数dsize的属性顺序问题。

例子

  1. 使用函数cv2.resize()完成一个简单的图像缩放。
import cv2 
img=cv2.imread("lena.jpg") 
rows, cols=img.shape[:2] 
size=(int(cols*0.9), int(rows*0.5)) 
rst=cv2.resize(img, size) 
print("img.shape=", img.shape) 
print("rst.shape=", rst.shape)
  1. 控制函数cv2.resize()的fx参数、fy参数,完成图像缩放
import cv2 
img=cv2.imread("lena.jpg") 
rst=cv2.resize(img, None, fx=2, fy=0.5) 
print("img.shape=", img.shape) 
print("rst.shape=", rst.shape)
  • fx进行的是水平方向的缩放
  • fy进行的是垂直方向的缩放
翻转

图像的翻转采用函数cv2.flip()实现

该函数能够实现图像在水平方向翻转、垂直方向翻转、两个方向同时翻转

dst = cv2.flip( src, flipCode )
  • dst代表和原始图像具有同样大小、类型的目标图像。

  • src代表要处理的原始图像

  • flipCode代表旋转类型。

    image-20220210222858094

    该函数中,目标像素点与原始像素点的关系可表述为:

    image-20220210222943803

例子

使用函数cv2.flip()完成图像的翻转

import cv2 
img=cv2.imread("lena.jpg") 
x=cv2.flip(img,0) 
y=cv2.flip(img,1) 
xy=cv2.flip(img, -1) 
cv2.imshow("img", img) 
cv2.imshow("x", x) 
cv2.imshow("y", y) 
cv2.imshow("xy", xy) 
cv2.waitKey() 
cv2.destroyAllWindows() 
仿射

仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。

该变换能够保持图像的平直性和平行性。

平直性是指图像经过仿射变换后,直线仍然是直线;平行性是指图像在完成仿射变换后,平行线仍然是平行线。

OpenCV中的仿射函数为cv2.warpAffine(),其通过一个变换矩阵(映射矩阵)M实现变换,具体为:

dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)

通过一个变换矩阵M,将原始图像O变换为仿射图像R。

image-20220210223410415

采用仿射函数cv2.warpAffine()实现对图像的变换,该函数的语法格式如下:

dst = cv2.warpAffine( src, M, dsize[, flags[, borderMode[, borderValue]]] )
  • dst代表仿射后的输出图像,该图像的类型和原始图像的类型相同。dsize决定输出图像的实际大小。
  • src代表要仿射的原始图像。
  • M代表一个2×3的变换矩阵。使用不同的变换矩阵,就可以实现不同的仿射变换。
  • dsize代表输出图像的尺寸大小。
  • flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时,意味着M是逆变换类型,实现从目标图像dst到原始图像src的逆变换。
  • borderMode代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
  • borderValue代表边界值,默认是0。

在OpenCV中使用函数cv2.warpAffine()实现仿射变换,忽略其可选参数后的语法格式为:

dst = cv2.warpAffine( src , M , dsize ) 

其通过转换矩阵M将原始图像src转换为目标图像dst:

dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)

进行何种形式的仿射变换完全取决于转换矩阵M。

平移

将原始图像src向右侧移动100个像素、向下方移动200个像素,则其对应关系为:

dst (x, y)=src (x+ 100, y+ 200)

将上述表达式补充完整,即:

dst (x, y)=src (1·x+ 0·y+ 100, 0·x+ 1·y+ 200)

可以确定对应的转换矩阵M中各个元素的值为:

image-20220210224328375

例子

图像平移

import cv2 
import numpy as np 
img=cv2.imread("lena.jpg") 
height, width=img.shape[:2] 
x=100 
y=200 
M = np.float32([[1, 0, x], [0, 1, y]]) 
move=cv2.warpAffine(img, M, (width, height)) 
cv2.imshow("original", img) 
cv2.imshow("move", move) 
cv2.waitKey() 
cv2.destroyAllWindows() 
旋转

可以通过函数cv2.getRotationMatrix2D()获取转换矩阵。该函数的语法格式为:

retval=cv2.getRotationMatrix2D(center, angle, scale)
  • center为旋转的中心点。
  • angle为旋转角度,正数表示逆时针旋转,负数表示顺时针旋转。
  • scale为变换尺度(缩放大小)。

想要以图像中心为圆点,逆时针旋转45°,并将目标图像缩小为原始图像的0.6倍,则在调用函数cv2.getRotationMatrix2D()生成转换矩阵M时所使用的语句为:

M=cv2.getRotationMatrix2D((width/2,height/2),45,0.6)

例子

图像旋转

import cv2 
img=cv2.imread("lena.jpg") 
height, width=img.shape[:2] 
M=cv2.getRotationMatrix2D((width/2, height/2),45,0.6) 
rotate=cv2.warpAffine(img, M, (width, height)) 
cv2.imshow("original", img) 
cv2.imshow("rotation", rotate) 
cv2.waitKey() 
cv2.destroyAllWindows() 
更复杂的仿射变换

对于更复杂仿射变换,OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。

该函数的语法格式为:

retval=cv2.getAffineTransform(src, dst) 
  • src代表输入图像的三个点坐标。
  • dst代表输出图像的三个点坐标。

参数值src和dst是包含三个二维数组(x, y)点的数组。

指代原始图像和目标图像内平行四边形的三个顶点(左上角、右上角、左下角)

上述参数通过函数cv2.getAffineTransform()定义了两个平行四边形。

src和dst中的三个点分别对应平行四边形的左上角、右上角、左下角三个点。

函数cv2.warpAffine()以函数cv2.getAffineTransform()获取的转换矩阵M为参数,将src中的点仿射到dst中。

函数cv2.getAffineTransform()对所指定的点完成映射后,将所有其他点的映射关系按照指定点的关系计算确定。

import cv2 
import numpy as np 
img=cv2.imread('lena.bmp') 
rows, cols, ch=img.shape 
p1=np.float32([[0,0], [cols-1,0], [0, rows-1]]) 
p2=np.float32([[0, rows*0.33], [cols*0.85, rows*0.25], [cols*0.15, rows*0.7]]) 
M=cv2.getAffineTransform(p1, p2) 
dst=cv2.warpAffine(img, M, (cols, rows)) 
cv2.imshow("origianl", img) 
cv2.imshow("result", dst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
透视
  • 仿射变换可以将矩形映射为任意平行四边形
  • 透视变换则可以将矩形映射为任意四边形

透视变换通过函数cv2.warpPerspective()实现

dst = cv2.warpPerspective( src, M, dsize[, flags[, borderMode[, borderValue]]] )
  • dst代表透视处理后的输出图像,该图像和原始图像具有相同的类型。dsize决定输出图像的实际大小。
  • src代表要透视的图像。
  • M代表一个3×3的变换矩阵。
  • dsize代表输出图像的尺寸大小。
  • flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时,意味着M是逆变换类型,能实现从目标图像dst到原始图像src的逆变换。
  • borderMode代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
  • borderValue代表边界值,默认是0。

与仿射变换一样,同样可以使用一个函数来生成函数cv2.warpPerspective()所使用的转换矩阵。

该函数是cv2.getPerspectiveTransform(),其语法格式为:

retval = cv2.getPerspectiveTransform( src, dst )
  • src代表输入图像的四个顶点的坐标。
  • dst代表输出图像的四个顶点的坐标。

src参数和dst参数是包含四个点的数组,与仿射变换函数cv2.getAffineTransform()中的三个点是不同的。

图像透视

import cv2 
import numpy as np 
img=cv2.imread('demo.bmp') 
rows, cols=img.shape[:2] 
pts1 = np.float32([[150,50], [400,50], [60,450], [310,450]]) 
pts2 = np.float32([[50,50], [rows-50,50], [50, cols-50], [rows-50, cols-50]]) 
M=cv2.getPerspectiveTransform(pts1, pts2) 
dst=cv2.warpPerspective(img, M, (cols, rows)) 
cv2.imshow("img", img) 
cv2.imshow("dst", dst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
重映射

把一幅图像内的像素点放置到另外一幅图像内的指定位置,这个过程称为重映射。

OpenCV内的重映射函数cv2.remap()其语法格式如下:

dst = cv2.remap( src, map1, map2, interpolation[, borderMode[, borderValue]] ) 
  • dst代表目标图像,它和src具有相同的大小和类型。

  • src代表原始图像。

  • map1参数有两种可能的值:

    • 表示(x, y)点的一个映射。
    • 表示CV_16SC2 , CV_32FC1, CV_32FC2类型(x, y)点的x值。
  • map2参数同样有两种可能的值:

    • 当map1表示(x, y)时,该值为空。
    • 当map1表示(x, y)点的x值时,该值是CV_16UC1, CV_32FC1类型(x, y)点的y值。

    map1,map2 可以代表的不仅仅是一个点,而是多个点

  • Interpolation代表插值方式,这里不支持INTER_AREA方法

    image-20220210220303659

  • borderMode代表边界模式。当该值为BORDER_TRANSPARENT时,表示目标图像内的对应源图像内奇异点(outliers)的像素不会被修改。

  • borderValue代表边界值,该值默认为0。

映射参数的理解

重映射通过修改像素点的位置得到一幅新图像。

在构建新图像时,需要确定新图像中每个像素点在原始图像中的位置。所以,映射函数的作用是查找新图像像素在原始图像内的位置,该过程是将新图像像素映射到原始图像的过程,因此被称为反向映射。

参数map1和参数map2用来说明反向映射,map1针对的是坐标x, map2针对的是坐标y。map1和map2的值都是浮点数。因此,目标图像可以映射回一个非整数的值,这意味着目标图像可以“反向映射”到原始图像中两个像素点之间的位置(该位置是不存在像素值的)。可以采用不同的方法实现插值,函数中的interpolation参数可以控制插值方式。

由于参数map1和参数map2的值是浮点数,所以通过函数cv2.remamp()所能实现的映射关系变得更加随意,可以通过自定义映射参数实现不同形式的映射。

函数cv2.remap()中参数map1指代的是像素点所在位置的列号,参数map2指代的是像素点所在位置的行号。

例如: 想将目标图像(映射结果图像)中某个点A映射为原始图像内处于第0行第3列上的像素点B,那么需要将A点所对应的参数map1对应位置上的值设为3,参数map2对应位置上的值设为0。所以,通常情况下,将map1写为mapx,并且将map2写成mapy。

如果想将目标图像(映射结果图像)中所有像素点都映射为原始图像内处于第0行第3列上的像素点B,那么需要将参数map1内的值均设为3,将参数map2内的值均设为0。

如果想将目标图像(映射结果图像)中所有像素点都映射为原始图像内处于第0行第3列上的像素点B,那么需要将参数map1内的值均设为3,将参数map2内的值均设为0。

例子

将目标数组内的所有像素点都映射为原始图像内第0行第3列上的像素点,

可以确定:

  • 用来指定列的参数map1(mapx)内的值均为3。
  • 用来指定行的参数map2(mapy)内的值均为0。
import cv2 
import numpy as np 
img=np.random.randint(0,256, size=[4,5], dtype=np.uint8) 
rows, cols=img.shape 
mapx = np.ones(img.shape, np.float32)*3 
mapy = np.ones(img.shape, np.float32)*0 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
print("img=\n", img) 
print("mapx=\n", mapx) 
print("mapy=\n", mapy) 
print("rst=\n", rst) 
# 目标图像(数组)dst内的所有值都来源于原始图像中第0行第3列上的像素值252。
复制

通过该函数实现图像的复制

在映射时,将参数进行如下处理:

  • 将map1的值设定为对应位置上的x轴坐标值。
  • 将map2的值设定为对应位置上的y轴坐标值。
import cv2 
import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
    for j in range(cols): 
        mapx.itemset((i, j), j) 
        mapy.itemset((i, j), i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
绕x轴翻转

如果想让图像绕着x轴翻转,意味着在映射过程中:

  • x坐标轴的值保持不变。
  • y坐标轴的值以x轴为对称轴进行交换。

反映在map1和map2上:

  • map1的值保持不变。
  • map2的值调整为“总行数-1-当前行号”。
import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
	for j in range(cols): 
		mapx.itemset((i, j), j) 
		mapy.itemset((i, j), rows-1-i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
绕y轴翻转

如果想让图像绕着y轴翻转,意味着在映射过程中:

  • y坐标轴的值保持不变。
  • x坐标轴的值以y轴为对称轴进行交换。

反映在map1和map2上:

  • map2的值保持不变。
  • map1的值调整为“总列数-1-当前列号”。
import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
	for j in range(cols): 
		mapx.itemset((i, j), cols-1-j) 
		mapy.itemset((i, j), i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
绕x轴、y轴翻转
  • x坐标轴的值以y轴为对称轴进行交换。
  • y坐标轴的值以x轴为对称轴进行交换。

反映在map1和map2上:

  • map1的值调整为“总列数-1-当前列号”。
  • map2的值调整为“总行数-1-当前行号”。
import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
	for j in range(cols): 
		mapx.itemset((i, j), cols-1-j) 
		mapy.itemset((i, j), rows-1-i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
x轴、y轴互换

如果想让图像的x轴、y轴互换,意味着在映射过程中,对于任意一点,都需要将其x轴、y轴坐标互换。

反映在mapx和mapy上:

  • mapx的值调整为所在行的行号。
  • mapy的值调整为所在列的列号。

如果行数和列数不一致,上述运算可能存在值无法映射的情况。默认情况下,无法完成映射的值会被处理为0。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
	for j in range(cols): 
		mapx.itemset((i, j), i) 
		mapy.itemset((i, j), j) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 
图像缩放

使用函数cv2.remap()缩小图像。

缩小图像后,可以将图像固定在围绕其中心的某个区域。

  • 在目标图像的x轴(0.25·x轴长度,0.75·x轴长度)区间内生成缩小图像;x轴其余区域的点取样自x轴上任意一点的值。

  • 在目标图像的y轴(0.25·y轴长度,0.75·y轴长度)区间内生成缩小图像;y轴其余区域的点取样自y轴上任意一点的值。

为了处理方便,不在上述区域的点都取(0,0)坐标点的值。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
	for j in range(cols): 
		if 0.25*cols< i <0.75*cols and 0.25*rows< j <0.75*rows: 
			mapx.itemset((i, j),2*( j - cols*0.25 ) + 0.5)   # x1关于x的映射函数 (x:0,x1:0.25) (x:1,x1:0.75)
			mapy.itemset((i, j),2*( i - rows*0.25 ) + 0.5) 
		else: 
			mapx.itemset((i, j),0) 
			mapy.itemset((i, j),0) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows() 

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;