Bootstrap

简述数据可视化的主要方法

简述数据可视化的主要方法

  1. 基于图表的数据可视化:
    基于图标的可视化数据可视化,是传统的标准2D/3D可视化技术,包括柱形图、条形图、面积图、堆积柱形图、折线图、饼图、直方图和分布图等。
    分类数据可以用条形图或饼图表达。条形图用宽度相同的条形的高度或长短来表示各类别数据的多少;饼图是用原形及院内扇形的角度来表示数值大小的图形,主要表示总体或样本中各组成部分所占的比例。
    顺序数据可以用通过累计频数分布图中的累计频数(cumulative frequencies)和累计频率(cumulative percentages)来表示。
    分类和顺序数据也可以通过环形图表示,环形图和饼图类似。饼图只能展示一个总体各部分所占的比例,环形图可以由多个环组成,每个环代表一个总体。适用于结构比较。
    分类数据可以使用直方图表示。在直角坐标系中,用横轴表示数据分段,纵轴表示频数或频率,各组与相应的频数(频率)就形成了矩形,组合起来就是直方图。实际上是用面积来表示各组的频数(频率)分布。把每组顶部的中点用直线连起来,再隐藏原来的直方图就得到了折线图。折线下方包围的面积和直方图的面积相等,二者表示的频数(频率)分布是一致的。
    未分组的原始数据可以通过茎叶图表示。以该组数据的高位数值作为树茎,低位数字作为树叶,树叶上只保留一位数据。茎叶图类似于横置的直方图。茎叶图既能给出数据的分布情况,又能给出每一个原始数值,保留了原始数据的信息。
    箱型图也可以用来表示未分组的原始数据,箱型图由一组数据的五数概括为特征绘制。五数概括包括:最大值、最小值、中位数、下四分位数、上四分位数。主要表示数据的中间部分的分布情况。
  2. 基于几何投影的数据可视化:
    基于几何投影技术的可视化方法的目的是发现多为数据集的令人感兴趣的投影,以此将对多为数据的分析转化为进队感兴趣的低维数据的分析。。基于集合投影的可视化技术包括:散点矩阵技术、安德鲁斯曲线技术、格架图、测量图、平行坐标可视化技术和放射性可视化技术等。
    散点图使用笛卡尔坐标显示二维数据点。使用不同颜色或不同形状来表示不同的数据点,以此在二维显示上可视化三维空间。三维散点图使用笛卡尔坐标系的三个坐标轴,如果也使用颜色区分,能够表示思维的数据点。
    当维数升高时,散点图失效。可采用散点图矩阵作为补充,散点图矩阵是二维散点图的n*n网络,提供每个维度的和所有其它维度的可视化。
    3.基于图标的数据可视化:
    基于图标的可视化技术把每个多维数据项映射成一个图标,这个图标是一些很小的图,其各个部分用来表示不同维度的数据属性,常用的图标有针形图标、星形图标等。基于图标的可视化技术包括Chernoff脸谱图、形状编码图、枝形图等。
    Chernoff脸谱图是统计学家赫尔曼·切尔诺夫于1973年引进的,它把多达18个变量(维度)的多维数据以卡通人脸表示。使用脸要素(眼、耳、鼻、口等)的形状、大小、位置和方向来表示维的值,例如:眼的大小。两眼的距离等等。Chernoff脸谱利用人对面部特征的识别敏感性来展示多维数据,有助于数据的规律性和不规律性的可视化。
;