Bootstrap

PCL点云学习六(边缘提取)

论文:Point Feature Extraction on 3D Range Scans Taking into Account Object Boundaries

论文阅读

  1. 摘简介
  • 使用点云生成的距离图像
  • 提取了前景到背景的边界
  • 使用NARF特征,提出了3维数据的特征点和描述符提取方法
    <1>:特征点需要所在平面稳定(具有稳定的法线)
    <2>:利用局部视图中的物体边界(因为物体边界是特殊的,边界的特征点和描述符会使整个过程更加具有鲁棒性),提出了一种边界提取方法
  1. border extraction(边界提取)
  • 可以将边界分为三个类型:object borders(物体边界)、shadow borders(遮挡边界),veil points(过渡边界)

  • 过渡边界是3D距离中一种特征,可以提高匹配精度和分类效果

  • 使用两个指标提取边界区域:法线变化、锐角、相邻点之间的距离变化(对于噪声和分辨率具有非常强的鲁棒性)

  • 对于距离图像中的每一个点和其邻域进行如下操作:
    <1> :使用启发式方法,计算不穿过边界的邻域点的距离值
    <2> :计算评分:用来描述点为边界的可能性
    <3> :区分边界点的类型
    <4> :使用非极大值抑制找到准确的边界位置

  • 启发式算法
    某个点的所有2d邻域点,对应3d距离位于同一平面的点
    p i p_i pi距离图像中的某一像素点
    { n 1 , . . . , n s 2 } : \{n_1,...,n_{s^2}\}: {n1,...,ns2}:像素 p i p_i pi为中心点的邻域点集,大小为S×S
    { d 0 , . . . , d s 2 } : \{d_0,...,d_{s^2}\}: {d0,...,ds2}:邻域点对应的3D距离
    { d 0 ′ , . . . , d s 2 ′ } : \{d'_0,...,d'_{s^2}\}: {d0,...,ds2}:按增量顺序排序的,邻域点对应的3D距离
    M : M: M:表示领域点内与像素点 p i p_i pi位于同一平面的点的最少个数
    δ = d M ′ \delta=d'_M δ=dM:表示代表性距离( p i − s p_i-s pis,不包含越界点)
    文章中 S S S=5, M = ( ( s + 1 ) 2 ) 2 = 9 M=(\frac{(s+1)}{2})^2=9 M=(2(s+1))2=9,具有最大值M的点,意味该点位于直角点

  • 计算可信度/评分
    计算四个方向具有边界的可能性(向上、向下、向左、向右):
    以向右为例:
    其右侧3维平均距离为:
    P x , y : P_{x,y}: Px,y:表示深度图像在x,y的点
    m p : m_p: mp:表示右侧用来计算点的个数,论文中为3
    p r i g h t = 1 m p ∑ i = 1 m p p x + i , y p_{right}=\frac{1}{m_p}\sum_{i=1}^{m_p}p_{x+i,y} pright=mp1i=1mppx+i,y
    使 p r i g h t p_{right} pright作为右邻域点,计算偏移:
    d r i g h t = ∣ ∣ p x , y − p r i g h t ∣ ∣ d_{right}=||p_{x,y}-p_{right}|| dright=px,ypright
    使用 d r i g h t ∈ [ 0 , 1 ) d_{right}\in[0,1) dright[0,1) δ \delta δ计算评分,分数越高具有边界可能性越高:
    s r i g h t = m a x ( 0 , 1 − δ d r i g h t ) s_{right}=max(0,1-\frac{\delta}{d_{right}}) sright=max(0,1drightδ)

  • 平滑去除噪声 (略)

  • 区分边界类型
    通过判断距离值实现:
    p x , y p_{x,y} px,y一个像素点
    { 物 体 边 界 p x , y < p r i g h t 遮 挡 边 界 p x , y > P r i g h t \begin{cases} 物体边界&p_{x,y}<p_{right}\\ 遮挡边界&p_{x,y}>P_{right}\\ \end{cases} {px,y<prightpx,y>Pright
    对于所有可能为边界点的 P x , y P_{x,y} Px,y,查找其右边对应的遮挡边界:
    在2D(x,y)像素邻域内(论文中文为3),找到评分做高的值,作为 s s h a d o w s_{shadow} sshadow,轻微的减小 s r i g h t s_{right} sright,如下:
    s r i g h t ′ = m a x ( 0.9 , 1 − ( 1 − s s h a d o w ) 3 ) ∗ s r i g h t s'_{right}=max(0.9,1-(1-s_{shadow})^3)*s_{right} sright=max(0.9,1(1sshadow)3)sright
    再检查 s r i g h t ′ > 0.8 s'_{right}>0.8 sright>0.8,且为相邻点 p x − 1 , y p_{x-1,y} px1,y p x + 1 , y p_{x+1,y} px+1,y的最大值:将 p x , y p_{x,y} px,y标记为物体边界,并标记对应遮挡边界,将遮挡边界与物体边界之间的区域标志为过渡区域。
    最后得到效果如下:
    在这里插入图片描述

  1. interest point extraction(兴趣/特征点提取)
  • 作用:减少搜索空间使特征提取聚焦于重要的点中

  • 对于兴趣点的指标:
    <1>: 必须考虑到边界和平面结构信息
    <2>: 对与一个视点从不同的视度均可以提取到(兴趣点在各个方向上均有明显变化)
    <3>: 具有稳定的法线或者相应的描述符可计算

  • 计算步骤
    <1> :遍历图像上的每一点,得到平面变化程度的评分(包含边界信息):曲率
    <2> :计算图像每一个点的周围的主要方向,得到一个兴趣值(指标<1>),计算这些兴趣值之间的差异(指标<2>)、计算点所在局部平面的变化程度(指标<3)
    <3> :对兴趣值进行平滑处理
    <4> :执行非最大抑制找到兴趣点
    上述过程中,最重要的指标为,支撑半径: σ \sigma σ,用来计算主导方向的兴趣值,与用来计算描述符需要考虑点的范围值相同,该值与想找到几何尺寸相关,值越大计算越大,特征越稳定,但是如果用来识别物体,该值越小越好,避免部分遮挡的影响,通常该值取待识别物体尺寸的0.25,如果识别大小不同的物体,需要使用多尺度。

  • 注意事项
    从之前的步骤,已知每一个点的上下左右的边界,对每一个边界像素仪45度步长对边界方向进行编码,
    ×通过计算邻域多个边界点的平均值可以减少误差
    ×应为距离图像为球坐标系下的值,在进行2D可视化时会失真,因此文中使用局部法线值(采用2D局部邻域内的像素点,使用PCA降维得到,忽略3D距离大于2 δ ( 边 界 估 计 时 的 参 数 ) \delta(边界估计时的参数) δ()与的点)。

  • <1> :细节
    表面变化与边界无关,对于每个点计算其邻域内的主曲率,得到其曲率的主方向和最大特征值。
    图像中每一个点都会得到一个主方向向量 v v v:是边界点的主方向或者非边界点的主方向,
    这些方向点的权重和为1,相对于其他点的权重为 1 − ( 1 − λ ) 3 1-(1-\lambda)^3 1(1λ)3

  • 当有足够的点,在三维直径 σ \sigma σ内,有足够的点,该结果对分辨率、视距和非均匀点分布保持不变,

  • <2>

  • 对于每一个像素上的点p;
    其邻域值为 { n 0 , . . . , n N } ( 距 离 小 于 0.5 σ ) \{n_0,...,n_N\}(距离小于0.5\sigma) {n0,...,nN}(0.5σ),且邻域内的点没有边界点;
    每个点 n i n_i ni,有一个主方向 v n i v_{ni} vni,权重 w n i w_{n_i} wni,为了减少来自于法线估计的噪声,将方向向量映射到与(像素点P与传感器位置连线之间构成的直线垂直)平面,对于每个 n i n_i ni我们都会得到一个一维角度 a n i a_{n_i} ani
    由于两个相反的向量不能确定唯一的位置,且主曲率也不能分析得到唯一的方向,文中采用如下方式得到位移的角度:
    α ′ = { 2 ∗ ( α − 180 ° ) α > 90 ° 2 ∗ ( α + 180 ° ) α < = − 90 ° \alpha'=\begin{cases} 2*(\alpha-180°) &\alpha>90°\\ 2*(\alpha+180°) &\alpha <=-90° \end{cases} α={2(α180°)2(α+180°)α>90°α<=90°
    得到效果图如下:
    在这里插入图片描述

  • <3>
    使用有界高斯核平滑角度和权重
    得到点 p p p兴趣点 I p I_p Ip如下,将超过阈值 I I I的值作为兴趣点:
    I 1 ( p ) = m i n i ( 1 − w n i m a x ( 1 − 10 ∗ ∣ ∣ p − n i ∣ ∣ σ , 0 ) ) f ( n ) = w n ( 1 − ∣ 2 ∗ ∣ ∣ p − n ∣ ∣ σ ∣ − 0.5 ) I 2 ( p ) = m a x i , j ( f ( n i ) f ( n j ) ( 1 − ∣ c o s ( α n i ′ − α n j ′ ) ∣ ) ) I ( p ) = I 1 ( p ) ∗ I 2 ( p ) I_1(p)=min_{i}(1-w_{n_i}max(1-\frac{10*||p-n_i||}{\sigma},0))\\ f(n)=\sqrt{w_n(1-|\frac{2*||p-n||}{\sigma}|-0.5)}\\ I_2(p)=max_{i,j}(f(n_i)f(n_j)(1-|cos(\alpha'_{n_i}-\alpha'_{n_j})|))\\ I(p)=I_1(p)*I_2(p) I1(p)=mini(1wnimax(1σ10pni,0))f(n)=wn(1σ2pn0.5) I2(p)=maxi,j(f(ni)f(nj)(1cos(αniαnj)))I(p)=I1(p)I2(p)
    I 1 : I_1: I1:可以提取具有高权重的的点值/平面剧烈变化
    I 2 : I_2: I2:可以提取又有一对相邻点的主方向具有剧烈变化的点
    下图具有不同的 σ 值 \sigma值 σ
    在这里插入图片描述
    下图中十字符号表示一个兴趣点位置。
    在这里插入图片描述

  1. NARF 描述子
  • 用来有效比较两个兴趣点的相似度

  • 作用
    <1> 利用被占空间和自由空间描述物体表面和物体轮廓
    <2> 使位置点具有鲁棒性(缩放旋转)
    <3> 为提取点提供了独特的局部坐标系
    <4> 机器人的滚动不变性可能会不必要地增加搜索空间的大小,因为机器人大部分时间都会以零滚动角运行。NARF描述符使我们能够在正常情况下提取一个独特的方向

  • 计算兴趣点的NARF步骤
    <1> 锁定视角:计算出距离图像上某点一个法向对齐距离值的局部平面,并沿法相方向观察该点(我认为是切平面)
    <2> 在该面片上覆盖一个星形图案,其中每个光束对应于最终描述符中的一个值
    <3> 它捕捉光束变化下像素的大小,从描述符中提取唯一的方向 (可选)
    <4> 并根据该值(方向)移动描述符,使其对旋转保持不变 (可选)

  • 计算对齐平面
    1)采用局部坐标系:以兴趣点为原点,z轴指向法向量,y轴根据世界坐标系中的垂直向量定向,将位于支撑半径 σ / 2 \sigma/2 σ/2内的所有点映射到该平面
    2)x,y,z坐标系就是描述符单元的坐标系,一个cell的值为所有映射点中,z值最小的,没有3D点映射的cell为 0.5 σ 0.5\sigma 0.5σ
    3)法线计算:PCA计算所有点,确保描述符具有最大的稳定性
    4)图像块(用来计算法线):大小应当适中,过大会导致结构失真,也不能过小超过分辨率,一般选用10×10大小
    5)高斯差值:防止在原始扫描分辨率较低的部分失真
    6)将具有n(一般n=36,每束光之间的差值为 10 ° 10\degree 10°)束星形投影到兴趣点所在的局部坐标,每束光 b i b_i bi对应一个网格的点集 { c 0 , . . . , c m } \{c_0,...,c_m\} {c0,...,cm}( c 0 c_0 c0为块的中间值,其余值按到 c 0 c_0 c0的距离排序)
    7)第i个光束的描述符 D i D_i Di

    w ( c j ) : w(c_j): w(cj):权重,块中间权重为2
    w ( c j ) = 2 − 2 ∗ ∣ ∣ c j − c 0 ∣ ∣ σ w(c_j)=2-\frac{2*||c_j-c_0||}{\sigma} w(cj)=2σ2cjc0
    D i ′ D'_i Di:几何意义离中心越近,表面的变化越大,变化越强烈,值越偏离0
    D i ′ = ∑ j = 0 m − 1 ( w ( c j ) ( c j + 1 − c j ) ) ∑ j = 0 m − 1 w ( c j ) D'_i=\frac{\sum^{m-1}_{j=0}(w(c_j)(c_{j+1}-c_j))}{\sum_{j=0}^{m-1}w(c_j)} Di=j=0m1w(cj)j=0m1(w(cj)(cj+1cj))
    D i D_i Di:将 D i ′ D'_i Di归一化到 [ − 0.5 , 0.5 ] [-0.5,0.5] [0.5,0.5]
    D i = a t a n 2 ( D i ′ , σ 2 ) 180 ° D_i=\frac{atan2(D_i',\frac{\sigma}{2})}{180°} Di=180°atan2(Di,2σ)
    最后得到了下图b(可视化描述符),左边箭头指向的网格具有低值(白色),右边箭头网格有较高值(黑色)
    在这里插入图片描述
    8)旋转不变性:将得到的描述符(360度)离散化为直方图,每个 β \beta β方向的单元格对应值如下:选择其中最大值作为主方向,并保存其中超过主方向 0.8 0.8 0.8倍的作为副方向
    γ i : \gamma_i: γi:角度方向上的第i个描述网格
    h ( β ) = 0.5 + 1 2 ∑ i = 1 n D i ( 1 − ∣ β − γ i ∣ 180 ° ) 2 h(\beta)=0.5+\frac{1}{2}\sum_{i=1}^nD_i(1-\frac{|\beta-\gamma _i|}{180°})^2 h(β)=0.5+21i=1nDi(1180°βγi)2
    9)描述符匹配:使用曼哈顿距离除以描述符中的单元数,这将距离标准化为[0,1]中的值,得到图c:
    在这里插入图片描述

  1. 验证旋转不变性、匹配效果、时间(略)

使用

  • 核心代码
    pcl::RangeImageBorderExtractor BEXT;                        //边缘提取容器
    pcl::RangeImage& range_image = *rangeimage_ptr;
    BEXT.setRangeImage(&range_image);
  • 具体使用
#include <iostream>
#include <boost/thread/thread.hpp>
#include <pcl/range_image/range_image.h>
#include <pcl/io/pcd_io.h>
#include <pcl/visualization/range_image_visualizer.h>
#include <pcl/visualization/pcl_visualizer.h>
#include <pcl/features/range_image_border_extractor.h>
#include <pcl/console/parse.h>
#include <pcl/visualization/common/float_image_utils.h>
#include <pcl/io/png_io.h>
#include <pcl/point_types.h>
#include <pcl/io/ply_io.h>
#include <pcl/filters/statistical_outlier_removal.h>
using namespace std;
using namespace pcl;
#define PointType pcl::PointXYZRGB
boost::shared_ptr<pcl::visualization::PCLVisualizer> RGB_viwer(pcl::PointCloud<pcl::PointXYZ>::Ptr cloud,
                                                              pcl::PointCloud<pcl::PointWithRange>::Ptr cloud1,
                                                              pcl::PointCloud<pcl::PointWithRange>::Ptr cloud2,
                                                              pcl::PointCloud<pcl::PointWithRange>::Ptr cloud3){
  boost::shared_ptr<pcl::visualization::PCLVisualizer> viewer(new pcl::visualization::PCLVisualizer("3D Viewer"));
  int v1(0);
  viewer->addPointCloud<pcl::PointXYZ>(cloud,"simple cloud");
  //设置点云属性
  viewer->setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE,1,"simple cloud");


  pcl::visualization::PointCloudColorHandlerCustom<pcl::PointWithRange> single_color1(cloud1,0,255,0);
  viewer->addPointCloud<pcl::PointWithRange>(cloud1,single_color1,"XYZ add color1");
  viewer->setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE,3,"XYZ add color1");

    int v2(1);

  pcl::visualization::PointCloudColorHandlerCustom<pcl::PointWithRange> single_color2(cloud2,255,0,0);
  viewer->addPointCloud<pcl::PointWithRange>(cloud2,single_color2,"XYZ add color2");
  viewer->setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE,3,"XYZ add color2");

    int v3(2);

  pcl::visualization::PointCloudColorHandlerCustom<pcl::PointWithRange> single_color3(cloud3,0,0,255);
  viewer->addPointCloud<pcl::PointWithRange>(cloud3,single_color3,"XYZ add color3");
  viewer->setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE,3,"XYZ add color3");
  viewer->addCoordinateSystem(1.0);
  return (viewer);
}
/**
 * @brief 保存为图片
 */
void Range_Image_write(const pcl::RangeImage::Ptr& rangeimage_ptr){
    float *ranges = rangeimage_ptr->getRangesArray();
    unsigned char* rgb_image = pcl::visualization::FloatImageUtils::getVisualImage(ranges,rangeimage_ptr->width,rangeimage_ptr->height);
    pcl::io::saveRgbPNGFile("/home/n1/notes/pcl/extra_broder/saveRangeImageRGB.png",rgb_image,rangeimage_ptr->width,rangeimage_ptr->height);
}

// class MyBEXT:pcl::RangeImageBorderExtractor{
// public:
//       void setParams(){

//       }

// }
int main(int argc, const char** argv) {
    PointCloud<PointXYZ>::Ptr cloud(new PointCloud<PointXYZ>());
    pcl::PointCloud<pcl::PointWithViewpoint> far_ranges;
    //读取点云
    io::loadPCDFile("/home/n1/notes/pcl/extra_broder/test.pcd",*cloud);
    io::loadPCDFile("/home/n1/notes/pcl/extra_broder/test.pcd",far_ranges);
    // //io::loadPLYFile("/home/n1/notes/pcl/extra_broder/init.ply",*cloud);
    // //转换为深度图
    StatisticalOutlierRemoval<PointXYZ> SOR;//  初始化对像离群点滤波
    SOR.setInputCloud(cloud);
    SOR.setMeanK(50);               ///最临近距离求取均值点的个数
    SOR.setStddevMulThresh(1);       //设置阈值 阈值=均值+设置系数*标准差 小于阈值为内点,大于阈值为离群点
    SOR.filter(*cloud);

    pcl::RangeImage::CoordinateFrame coord_frame=pcl::RangeImage::CAMERA_FRAME;//X向右,y向下,z向前
    float angulareslution=(float)(0.5f*(M_PI/180.0f));    //1度
    float noiseLevel=0.0;
    float minRangle=0.0;      //通过归一化的Z缓冲器创建图像,minRangle>0,可视化最小距离
    int borderSize=1;       	/*border_size获得深度图像的边缘的宽度:在裁剪图像时,如果 borderSize>O ,将在图像周围留下当前视点不可见点的边界*/
    pcl::RangeImage::CoordinateFrame coordinate_frame = pcl::RangeImage::CAMERA_FRAME;
    pcl::RangeImage::Ptr rangeimage_ptr(new pcl::RangeImage());
    Eigen::Affine3f sensor_pose= (Eigen::Affine3f)Eigen::Translation3f(0.0f, 0.0f, 0.0f);
    rangeimage_ptr->createFromPointCloud(*cloud,angulareslution,pcl::deg2rad(360.0f),pcl::deg2rad(180.0f),sensor_pose,coordinate_frame,noiseLevel,minRangle,borderSize);
    rangeimage_ptr->integrateFarRanges(far_ranges);  //很重要
    //保存为图片
    Range_Image_write(rangeimage_ptr);
    

    //提取边界 提取物体边界、阴影边界、毗连与被遮挡背景的点集
    pcl::RangeImageBorderExtractor BEXT;                        //边缘提取容器
    pcl::RangeImage& range_image = *rangeimage_ptr;
    BEXT.setRangeImage(&range_image);
    pcl::PointCloud<pcl::BorderDescription> border_descriptions;//边界点的描述信息
    // BorderDescription:
    //              x,y,bitset(32)
    BEXT.compute(border_descriptions);
    
    pcl::PointCloud<pcl::PointWithRange>::Ptr obscaleborder_ptr(new pcl::PointCloud<pcl::PointWithRange>());
        pcl::PointCloud<pcl::PointWithRange>::Ptr viaborder_ptr(new pcl::PointCloud<pcl::PointWithRange>());
            pcl::PointCloud<pcl::PointWithRange>::Ptr shadownborder_ptr(new pcl::PointCloud<pcl::PointWithRange>());
    for(int i=0;i<rangeimage_ptr->height;i++){
      for(int j=0;j<rangeimage_ptr->width;j++){
          //当为物体边界
          if(border_descriptions.points[i*range_image.width + j].traits[pcl::BORDER_TRAIT__OBSTACLE_BORDER]){
            obscaleborder_ptr->points.push_back(range_image.points[i*range_image.width + j]);
          }
          //via
          if(border_descriptions.points[i*range_image.width + j].traits[pcl::BORDER_TRAIT__VEIL_POINT]){
            viaborder_ptr->points.push_back(range_image.points[i*range_image.width + j]);
          }
          //隐藏点
          if(border_descriptions.points[i*range_image.width + j].traits[pcl::BORDER_TRAIT__SHADOW_BORDER]){
            shadownborder_ptr->points.push_back(range_image.points[i*range_image.width + j]);
          }
      }
    }
    //可视化
    cout<<"obscaleborder_ptr size:"<<obscaleborder_ptr->size()<<endl;
        cout<<"viaborder_ptr size:"<<viaborder_ptr->size()<<endl;
            cout<<"shadownborder_ptr size:"<<shadownborder_ptr->size()<<endl;
    boost::shared_ptr<pcl::visualization::PCLVisualizer> viewer (new pcl::visualization::PCLVisualizer ("3D Viewer"));
    
    viewer=RGB_viwer(cloud,obscaleborder_ptr,viaborder_ptr,shadownborder_ptr);

    while (!viewer->wasStopped()){
        viewer->spinOnce (100);
        boost::this_thread::sleep (boost::posix_time::microseconds (100000));
    }
    return 0;
}
  • 修改参数(不建议使用)
    自定义一个类:
class MyBEXT:public pcl::RangeImageBorderExtractor{
public:
      void set_params(int max_no_of_threads=2,int pixel_radius_borders=3,int pixel_radius_plane_extraction=2,
                int pixel_radius_border_direction=3,float minimum_border_probability=0.8f,int pixel_radius_principal_curvature=2){
                  parameters_.max_no_of_threads=max_no_of_threads;
                  parameters_.pixel_radius_borders=pixel_radius_borders;
                  parameters_.pixel_radius_plane_extraction=pixel_radius_plane_extraction;
                  parameters_.pixel_radius_border_direction=pixel_radius_border_direction;
                  parameters_.minimum_border_probability=minimum_border_probability;
                  parameters_.pixel_radius_principal_curvature=pixel_radius_principal_curvature;
        // int max_no_of_threads=1;                 线程数
        // int pixel_radius_borders=3;              边阶搜索半径
        // int pixel_radius_plane_extraction=2;     计算平面变化棒经
        // int pixel_radius_border_direction=3;     点主要防线的半径
        // float minimum_border_probability=0.8f;      score评分超过该值认为是边界点
        // int pixel_radius_principal_curvature=2;  计算兴趣点主曲率的半径
      }
};

替换:

    // pcl::RangeImageBorderExtractor BEXT;                        //边缘提取容器
    // pcl::RangeImage& range_image = *rangeimage_ptr;
    // BEXT.setRangeImage(&range_image);
    // pcl::PointCloud<pcl::BorderDescription> border_descriptions;//边界点的描述信息
    // // BorderDescription:
    // //              x,y,bitset(32)
    // BEXT.compute(border_descriptions);
    MyBEXT BEXT;                        //边缘提取容器
    pcl::RangeImage& range_image = *rangeimage_ptr;
    BEXT.setRangeImage(&range_image);
    BEXT.set_params(2,3,2,3,0.7,2);
    pcl::PointCloud<pcl::BorderDescription> border_descriptions;//边界点的描述信息
    BEXT.compute(border_descriptions);  
;