学习opencv基础

源文地址：http://blog.chinaunix.net/uid-8402201-id-2899695.html
OpenCv中文论坛精华地址
http://www.opencv.org.cn/index.php/User:Ollydbg23
http://sivp.sourceforge.net/(sivp)
一、基础操作
1. 数据类型数据结构了解
   图像相关：cvArr cvMat IplImage

   数据数组的维数，与数据的通道数见P46 (76)

2. 常见的矩阵操作熟悉

3. 数据的保存和读取

4. 图像的加载和显示

5. 视频的操作

6. 内存与序列
a. 内存存储器
CvMemStorage

      双向链表动态对象(cvSeq cvSet)的内存
      cvCreateMemStorage
      cvReleaseMemStorage
      cvClearMemStorage 不返还系统
      cvMemStorageAlloc

   b. 序列
      是内存存储器可以存储的一种对象。双端队列
      CvSeq

      方法：
      cvCreateSeq
      cvClearSeq
      cvGetSeqElem
      cvCloneSeq cvSeqSlice cvSeqRemoveSlice cvSeqInsertSlice
      cvSeqSort
      cvSeqSearch
      cvSeqInvert
      cvSeqPartition
      堆栈操作   cvSeqPush cvSeqPushFront cvSeqPop cvSeqPopFront cvSeqPushMulti cvSeqPopMulti
      cvSeqInsert cvSeqRemove
      cvSetSeqBlockSize
      读出和写入: CvSeqWriter结构 cvStartWriteSeq cvStartAppendToSeq cvEndWriteSeq cvFlushSeqWriter
                                    CV_WRITE_SEQ_ELEM CV_WRITE_SEQ_ELEM_VAR
                   CvSeqReader结构 cvStartReadSeq   cvGetSeqReaderPos   cvSetSeqReaderPos
                                    CV_NEXT_SEQ_ELEM V_PREV_SEQ_ELEM CV_READ_SEQ_ELEM CV_REV_READ_SEQ_ELEM
      数组互相转换 cvCvtSeqToArray cvMakeSeqHeaderForArray

二. 图像的处理
1. 图像的平滑 cvSmooth

   主要应用: 去除噪声，失真，降低图像的分辨率。
   主要方法: CV_BLUR   CV_BLUR_NO_SCALE CV_MEDIAN CV_GAUSSIAN CV_BILATERAL

2. 图像形态学 cvErode cvDilate cvMorphologyEx
   主要作用：消除噪声分割等
   相关方法
   a. 腐蚀   消除噪声斑点
   b. 膨胀   连通被噪声、阴影分割的区域
   c. 开运算先腐蚀后膨胀
   d. 闭运算先膨胀后腐蚀
   e. 形态梯度
   f. "礼貌"
   g. "黑帽"

3. 漫水填充算法 cvFloodFill
作用：标记或者分离图像的一部分。从输入图像获取掩码区域。
原理: 把邻近区域所有相似点填充为种子点同样的颜色。

4. 尺寸调整 cvResize
   ROI的影响

   插值方法的选择

5. 图像金字塔 cvPyrDown cvPyrUp cvPyrSegmentation
   简介：源于同一原始图像的连续降采样获得的一个图像的集合。
   方法：高斯图像金字塔拉普拉斯图像金字塔
   应用：图像分割

6. 阀值化 cvThreshold cvAdaptiveThreshold
一般阀值化
自适应阀值化：针对有很强照明或反射梯度的图像，需要根据梯度进行阀值化

三、图像的变换
1. 卷积 cvFilter2D
   数学公式: z(t)=f(t)*g(t)= ∫f(m)g(t-m)dm
             h(x)=(f*g)(x)
   描述：变换的基础
   卷积核：参考点核支撑
   计算方法：图像参考点 = Σ 核点*对应图像点

   卷积边界: cvCopyMakeBorder

2. 梯度和Sobel导数 cvSobel
   导数的计算：最重要且是最基本的卷积
   注意： Sobel导数并不是真正的导数，它是离散空间的拟合。
          用大核可以对导数有更好的逼近。
   scharr滤波器: sobel算子小核时精度低，应使用scharr滤波器。

3. 拉普拉斯变换 cvLaplace
描述：二阶导数二阶Sobel导数
应用: 检测"团块" 边缘检测

4. Canny算子 cvCanny
描述：轮廓拼装
应用: 边缘检测

5. 霍夫变换
应用：在图像中寻找直线、圆等其他简单图形的方法。
霍夫线变换 cvHoughLines2

霍夫圆变换 (霍夫梯度法) cvHoughCircles

6. 重映射 cvRemap

7. 拉伸收缩扭曲旋转
   仿射变换

     稠密仿射变换: cvWarpAffine
                   计算变换矩阵: cvGetAffineTransform cv2DRotationMatrix

     稀疏仿射变换: cvTransform
                   应用于一系列孤立点的映射

   透射变换：
     密集透射变换: cvWarpPerspective
                   计算变换矩阵: cvGetPerspectiveTransform
     稀疏透射变换: cvPerspectiveTransform

8. cvCartToPolar cvPolarToCart
笛卡尔坐标系和极坐标系的转换

9. LogPolar
对数极坐标变换 cvLogPolar

10. 离散傅立叶变换 DFT
http://wenku.baidu.com/view/e3b7f0fdc8d376eeaeaa3187.html
http://wlsyzx.yzu.edu.cn/kcwz/szxhcl/kechenneirong/jiaoan/jiaoan3.htm

cvDFT函数(实现了FFT算法)

cvGetOptimalDFTSize cvGetSubRect

cvMulSpectrums

11. 离散余弦变换 DCT
实数的处理 cvDCT

12. 积分图像 cvIntegral
作用：子区域的快速求和
应用：人脸识别

13. 距离变换 cvDistTransform
输入为边缘检测的图像

14. 直方图均衡化 cvEqualizeHist
    应用：图像亮度分布比较集中，将亮度分布范围拉宽

四、直方图
    直方图：信息的一种表达方式，数据分布的统计图。
            对边缘色彩角亮度等特征的统计

bin：区间即竖条

1. 数据结构
   CvHistogram

2. 操作函数
   cvCreateHist
   cvQueryHistValue_1D
   cvGetHistValue_1D
   cvNormalizeHist
   cvThreshHist
   cvCopyHist
   cvGetMinMaxHistValue
   cvCalcHist

cvCompareHist (五种比较方法： CV_COMP_CORREL CV_COMP_CHISQR CV_COMP_INTERSECT CV_COMP_BHATTACHARYYA EMD)
寻找相关和匹配

3. 应用
   HSV: H(色调)    S(饱和度)     V(亮度值)
   a. EMD 方法利用直方图的距离测量来代替直方图的匹配策略
      光线的变化引起图像颜色值的变化
      cvCalcEMD2

   b. 反向投影(back projection)
      寻找目标
      cvCalcBackProject()计算一个像素是否是一个已知目标的一部分
      cvCalcBackProjectPatch()计算一块区域是否包含已知的目标 (区域检测器目标检测器)

得到目标图像的概率值，用cvMinMaxLoc()确定目标在图像的位置

   c. 模板匹配 cvMatchTemplate
      不是基于直方图。通过在输入图像上滑动图像快对实际的图像快和输入图像进行匹配。

      cvNormalize

五、轮廓 cvFindContours()
   根据边缘像素(canny)组装成轮廓。
   用序列的数据结构表示轮廓信息。
   处理的图像： cvCanny()输出图像或者 cvThreshold() cvAdaptiveThreshold()的输出图像

重要概念：轮廓树
外轮廓(c) 内轮廓(h hole)

1. cvFindContours()
输入图像 8通道二值化的图像

2. 方法
   cvFindContours
   cvStartFindContours
   cvFindNextContour
   cvSubstituteContour
   cvEndFindContour
   cvApproxChains

3. 绘制轮廓
cvDrawContours

4. 轮廓的识别和处理
   简化或拟合轮廓，匹配轮廓到模板
   a. 多边形逼近
     cvApproxPoly
     cvFindDominantPoints 寻找关键点

   b. 特性概括
      长度其他度量轮廓矩

      长度 cvContourPerimeter() cvArcLength
      面积 cvContourArea
      边界框 cvBoundingRect cvMinAreaRect2
             cvMinEnclosingCircle 最小包围圆
             cvFitEllipse2 最佳拟合圆

   c. 几何几个实用函数
      cvMaxRect
      cvBoxPoints
      cvPointSeqFromMat
      cvPointPolygonTest

5. 轮廓匹配
a. 矩
轮廓矩：比较2个轮廓最简单的方式

struct CvMoments

      cvContoursMoments 输入的是轮廓(CvSeq表示)
      cvMoments          输入的是图像
      cvGetCentralMoment
      cvGetNormalizedCentralMoment
      cvGetHuMoments     Hu矩是中心矩和归一化矩的线性组合

   b. cvMatchShapes 用Hu矩匹配

   c. 等级匹配
      轮廓树：此处的概念和之前的不同。
      轮廓树的创建过程。
      比较2个树的相似度。
      cvCreateContourTree 创建轮廓树
      cvContourFromContourTree
      cvMatchContourTrees 比较

六、图像的局部和分割
如何从图像中将目标或部分目标分割出来。
1. 背景减除

   快速背景建模方法：光照变化不大的室内
   codebook方法：    室内外环境，周期性运动灯光缓慢变化(速度较慢)

   背景和前景

   a. 背景减除缺点
   假设：所有像素是独立的。

   亮度的变化

   b. 场景建模
   前景与背景的转化
   新的前景-旧的前景-背景

   c. 像素片段
    像素在一段时间内变化。
    对这种波动建立模型。
    cvInitLineIterator
    CV_NEXT_LINE_POINT()

   d. 帧差
   最简单的背景减除方法就是用一帧减去另一帧，将差别作为前景。
   cvAbsDiff

   e. 平均背景法
   适用于：背景场景不包含运动的部分，要求光线保持不变。
   cvAcc() cvAbsDiff() cvInRange()

其他类似cvAcc()的累积函数：cvRunningAvg cvSquareAcc cvMultiplyAcc

   f. 高级背景建模(codebook算法)
      http://www.opencv.org.cn/forum/viewtopic.php?f=1&t=4648&sid=3d75687ebbd68be7b92b817ec0b10dba
      适用于：有运动目标(摇曳的树)，有光线的变化

      方法: 得到每个像素或一组像素的时间序列模型。(消耗大量内存)
      codebook(编码本): 一个像素现在的观测值和先前的观测值的比较。
      RGB空间
      YUV空间、
      HSV空间(与亮度相关) // hue色度，saturation纯度，value亮度

     codebook算法(注意它不能处理不同模式的光)
     f.1 结构
      struct code_book
      struct ce

     f.2 方法
      update_codebook:      定时调用，训练和学习 (创建codebook模型)
      clear_stale_entries：调用update_codebook一段时间后，调用这个函数做清除操作 (清除很少使用的码本条目)
      background_diff:      使用经验模型在先前的背景中将前景目标的像素分割出来

     f.3 codebook算法操作步骤
          见P318(348 )

   g. 清除前景的连通部分 (学习开运算闭运算轮廓好的例程)
       功能强大的在背景中去除噪声的技术
      find_connected_components

2. 分水岭算法 cvWatershed
标记图像，根据标记来分割图像

3. 用Inpainting来修补图像 cvInpaint()
修复图像

4. 均值漂移分割
cvPyrMeanShiftFiltering: finds the peaks of color distributions over space (从空间考虑)
cvMeanShift (运动跟踪章节): finds the peak of a color-spatial (or other feature) distribution over time(时间考虑)

参考图像金字塔(cvPyrUp, cvPyrDown)

5. Delaunay三角剖分和Voronoi划分
Delaunay三角剖分是表现三维形状的基础，是连接计算机视觉与计算机图形学的桥梁。

opencv仅实现了二维的Delaunay三角剖分.

   二维的Delaunay三角剖分的应用：运动场景跟踪目标识别不同摄像机的场景匹配


七、运动与跟踪
1. 跟踪基础
   识别：矩颜色直方图
          跟踪视觉上重要的关键点，而不是整个物体。
          lucas-Kanade Horn-Schunk方法 (稀疏和稠密光流)
   建模：

2. 寻找角点 cvGoodFeaturesToTrack
关键点，特征点

   一个点在两个正交的方向都有明显的导数。
   Harris角点: 角点位于图像二阶导数的自相关矩阵有两个最大特征值的地方。
               同时对移动和旋转不变

3. 亚像素角点 cvFindCornerSubPix
精确测量
应用：标定，跟踪，三维重建

4. 不变特征
SIFT

5. 光流
   a. 稀疏光流
     a.1 LK算法 cvCalcOpticalFlowLK
         感兴趣点的小窗口。
         缺点: 点会移出小窗口
        a.1.1 原理
              3个假设亮度恒定；时间连续或者运动是"小运动；空间一致
              v = - It/Ix

        a.1.2 一维光流
              前2个假设
              (迭代的方法解决假设不十分正确的情况)

        a.1.2 二维光流
              考虑第3个假设解不定方程

     a.2 金字塔LK算法 cvCalcOpticalFlowPyrLK
         解决大而不连贯的运动，即不满足小而连贯的假设

   b. 稠密光流
     b.1 Horm-Schunck
        cvCalcOpticalFlowHS
     b.2 块匹配方法
        cvCalcOpticalFlowBM

6. MEAN-SHIFT CAM-SHIFT
a. mean-shift cvMeanShift
通用方法，可以跟踪物体的运动

   b. cam-shift cvCamShift
   建立在mean-shift之上，跟踪视频中尺寸可能产生变换的目标
   窗口可以调整

7. 运动模板
应用：姿态识别
实心轮廓的获取

   建立模板：cvUpdateMotionHistory (需要传入轮廓)
   计算梯度：cvCalcMotionGradient
   分割：    cvSegmentMotion

8. 预估器
   应用：目标跟踪

   分两个阶段：预估阶段校正阶段

a. Kalman Filter

b. Condensation Algorithm 粒子滤波(参考书 probalistic robotic)
http://zhengjunliu360.blog.163.com/blog/static/53797102201032734617104/

八、标定
   http://www.vision.caltech.edu/bouguetj/calib_doc/
   http://www.opencv.org.cn/forum/viewtopic.php?f=1&t=4603
   张正友经典的论文《A Flexible New Technique for Camera Calibration》

   针孔模型
   透镜的畸变
   标定过程：摄像机几何模型透镜的畸变模型
   单应变换   homograph transform

2件事情：矫正畸变效应；
根据获得的图像重构三维场景

1. 摄像机模型
   针孔模型
   主点：光轴与图像平面的交点
   cx, cy: 芯片通常不在光轴上，故引入这2个变量
   fx = F * sx fy = F * sy

   x = f*(X/Z) ---> xs = fx*(X/Z) + cx

   a. 基本投影几何
      投影变换
      q = M*Q
      M 为(fx, fy, cx, cy)表示的摄像机内参数矩阵
      Q: 物理点
      q: 图像平面的点（用投影变换的n+1维坐标表示）

cvConvertPointsHomogenious：齐次坐标处理函数

   b. 透镜畸变
      针孔成像光线少，且成像慢，故使用透镜，但是会引入畸变。

      径向畸变：来自透镜的形状。
                远离中心，畸变越厉害，便宜的网络摄像机非常厉害。
                xc = x(1+k1*r*r+k2*r*r*r*r+k3*r*r*r*r*r*r) 注意r的影响

切向畸变：来自整个摄像机的组装过程；透镜本身与图像平面不平行造成的。
xc = x+[2*p1*y+p2*(r*r+2x*x)]

畸变向量： k1 k2 p1 p2 k3

2. 标定 cvCalibrateCamera2
   标定方法：摄像机对准一个有很多独立可标识点的物体。通过旋转和移动物体，
           在不同角度观看这个物体，可以利用通过每个图像计算摄像机的相对位置
           和方向以及摄像机的内参数。

   a. 旋转矩阵和平移向量
      摄像机坐标系物体坐标系(世界坐标系) <之前的公式是建立在一个坐标系的>
      Pc = R*(Po - T)
      3个旋转+3个平移共6个参数

6+4个内参数 = 10 至少需要2个视角？？

   b. 棋盘 cvFindChessboardCorners
      OPENCV不是使用基于3D构造物体的视场，而是使用平面物体的多个视场。
      cvFindCornerSubPix()提高精度
      cvDrawChessboardCorners

   c. 单应性变换 homograph transform

      单应性：从一个平面到另一个平面的投影映射。 (Z = 0)
              如二维平面上的点映射到摄像机成像仪上的映射。
            q = s*M*W*Q
            W = [R t] 物理变换
            M: 内参矩阵
     H = s*M*W 单应性矩阵
     关注点：不是空间中所有的Q，而只是平面上的Q，故使Z = 0。
     opencv 正是利用从多个视场计算多个单应性矩阵的方法来求解摄像机内参数。cvFindHomography

   d. 摄像机标定 cvCalibrateCamera2
      为摄像机内参数和畸变参数进行摄像机标定。
      d.1.
       至少需要10幅 7X8的图像
      d.2 cvFindExtrinsicCameraParams2 只计算外参数

3. 矫正
a. cvUndistort2
b. cvInitUndistortMap cvRemap
c. cvUndistortPoints

4. 标定完整程序

5. cvRodrigues2
函数提供2种表示之间的相互转换

   旋转的表示方法：
   直观的方法：向量r表示
   简单的方法：旋转矩阵R

九、投影和三维视觉

十、机器学习
http://cs229.stanford.edu/materials.html 网络资料
1. 基本概念
目的：把数据转换为信息。

1.1 训练集和测试集
特征
"聚类"算法 "分类"算法

训练集测试集 (验证集)
分类器

训练分类器的方法

1.2 监督数据和无监督数据
监督数据：数据有标签(人脸有年龄) 分类
无监督数据: 数据无标签聚类

分类回归

    无监督的聚类数据经常形成一个特征向量供更高层的有监督的分类器使用。

    两个典型的机器学习任务：分类聚类
    计算机视觉的两个基本任务：识别分割

1.3 生成模型和判别模型
判别算法
产生式算法

1.4 机器学习算法
    Mahalanobis       （归一化特征的方差）非分类和聚类算法
    K均值             非监督的聚类方法
    朴素贝叶斯分类器通用的分类器
    决策树            判别分类器
    Boosting          多个判别子分类器的组合
    随机森林          由决策树组成的"森林"
    人脸检测/Harr分类器   巧妙使用Boosting
    期望最大化(EM)
    K近邻             最简单的分类器
    神经网络          (字符识别)
    支持向量机(SVM)   分类和递归

1.5 视觉中使用机器学习算法
    (特征)
    采集数据       www.flicker.com(图片网站)
    给数据定标签 (http://www.mturk.com/mturk/welcome)
    提取特征（直方图色彩）处理(归一化)
    训练集测试集验证集
    选择分类器(计算速度数据形式内存大小)

1.6 特征向量的重要性
决策树
随机森林

用途：减少分类器需要考虑的特征的个数。
Breiman的变量重要性算法步骤：见P536 (P506)

1.7 诊断机器学习中的问题
Andrew Ng“Advice for Applying Machine Learning”
(http://www.stanford.edu/class/cs229/materials/ML-advice.pdf)
a. 大量数据比少量数据好
b. 好的特征比好的算法更重要

     选取特征：
              最大化它们的独立性
              最小化它们在不同环境之下的变化。
    c. 欠拟合   模型假设太严格
       训练和测试都不好
    d. 过拟合   学习了噪声等
       训练很好测试不好
    e. 常见问题解决见表13-2

f. 评价分类器的性能
交叉验证自抽样法 ROC曲线混淆矩阵

2. ML

2.1 函数
    save
    load (先调用clear)
    clear
    train
    predict
    CvStatModel
    write
    read

2.2 train
(行，列) =(数据样本，特征变量)

2.3 predict

2.4 迭代次数

3. Mahalanobis
   有些分类器(K邻近)很难处理方差很大的数据
   cvCalcCovarMatrix 计算协方差矩阵
   cvInvert           计算逆矩阵
   cvMahalanobis

4. K-mean cvKMeans2
聚类算法

问题和解决：方差最小

5. 朴素贝叶斯分类
最简单监督学习分类器

6. 二叉决策树
   回归不纯度
   分类不纯度
   度量：熵   吉尼系数错分类

   特征的重要性 get_var_importance()
   过拟合：先建立树，然后修剪

学习opencv基础

悦读