Bootstrap

【数据图表】最常用的数据图表(数据分析必看)


如何选择图表的类型
你想展示什么

(一)条形图与柱状图

条形图_百度百科 (baidu.com)
漫谈条形图 - 知乎 (zhihu.com)
条形图(Bar Chart)和柱状图(Column Chart)实际上是同一种类型的图表,它们都是用来展示和比较不同类别的数据。两者之间的主要区别在于矩形条的方向:

  • 条形图:通常指的是水平条形图,其中每个数据类别用一个水平的矩形条表示,条形的长度与数值成正比。这种布局使得当类别名称较长时,更容易阅读;
  • 柱状图:指的是垂直条形图,每个数据类别由一个垂直的矩形条表示,其高度与数值成正比。它适合用于显示时间序列数据或有序数据。

无论是条形图还是柱状图,它们都可以有效地帮助观众快速理解各类别之间的差异、对比以及总体趋势。此外,两种图表类型都可以扩展为堆叠式(Stacked)或者分组(Grouped)形式,以便于更复杂的数据关系展示,例如部分到整体的关系或是多个数据系列之间的比较。使用条形图的情况:

  • 比较不同类别的数据:当需要比较几个不同类别之间的数值大小时,条形图是一个理想的选择。例如,比较不同产品的销售额、各个国家的人口数量等;
  • 展示有序数据:如果数据有自然顺序(如年龄组、时间序列),条形图可以帮助清晰地显示这种顺序以及相应的数值变化;
  • 长标签的类别名称:当类别名称较长或较多时,水平条形图可以使得这些标签更容易阅读和理解,避免了垂直柱状图中可能出现的标签重叠问题;
  • 部分与整体的关系:通过堆叠条形图的形式,可以展示每个大类别中的细分部分及其对整体的贡献,有助于分析各组成部分的比例关系;
  • 显示负面值:条形图能够有效地表示包含负数值的数据集,例如财务报表中的收入和支出情况,便于直观对比正负数值;
  • 多变量数据的比较:分组条形图(也称为并列条形图)允许同时比较多个变量在不同类别间的分布情况,比如比较男性和女性在不同年龄段的平均收入。

1.簇状条形图和三维簇状条形图

又叫分组条形图,是一种以不同分组高度、相同的长方形的宽度为变量的统计图表,每个分组中的柱子使用不同的颜色或者相同颜色不同透明的方式区别各个分类,各个分组之间需要保持间隔。在分组条形图中,通常沿垂直轴组织类别,而沿水平轴组织数值。分组条形图经常用于相同分类数据不同组间数据之间的比较,通常适用于当使用者需要在同一个轴上显示各个分类下不同的分组时,如果表内分组过多,会导致柱子过密,则不适用于使用分组柱状图。三维簇状条形图以三维格式显示水平矩形,而不以三维格式显示数据。

簇状条形图
三维簇状条形图

适用场景:

  • 多变量对比:当你需要在同一主类别下比较多个子类别的数值时,簇状条形图非常有用。例如,比较不同性别在各个年龄段的平均收入;
  • 展示变化趋势:如果目的是展示随时间或其他连续变量变化的趋势,并且希望同时比较几个相关变量的变化情况,簇状条形图可以提供清晰的视觉对比;
  • 分类间对比:当需要对两个或更多的群体进行详细分析和对比时,比如比较不同地区的教育水平、健康状况等,簇状条形图能够有效地展示各群体内部的不同子类别数据;
  • 易于理解的数据结构:对于那些拥有明确分类和子分类的数据集,使用簇状条形图可以帮助观众快速理解数据间的相对关系。

不适用场景:

  • 过多的子类别:如果一个主类别下有太多的子类别,簇状条形图可能会变得拥挤且难以阅读。此时可能需要考虑其他类型的图表,如堆叠条形图或瀑布图;
  • 复杂的数据关系:当数据关系较为复杂,涉及到多层嵌套分类或需要展示更细致的数据分布时,簇状条形图可能不是最佳选择。这种情况下,树状图或多级饼图等可能更为合适;
  • 连续型数据的分布:对于展示连续型数据的分布情况,如测试成绩的分布、用户的年龄分布等,直方图通常比簇状条形图更适合;
  • 强调部分与整体的关系:如果重点在于展示每个主类别中各个子类别的比例以及它们如何共同构成整体,那么堆叠条形图可能是更好的选择,因为它能更直接地表现这种关系。

2.堆积条形图和三维堆积条形图

堆积条形图(Stacked Bar Chart)是一种有效的数据可视化工具,通过将相同主类别下的不同子类别的值堆叠在一起,与并排显示的分组条形图不同,堆叠条形图将每个柱子进行分割以显示相同类型下各个数据的大小情况。堆叠条形图可以形象的展示一个大分类包含的各个小分类的数据,或者是各个小分类占总分类的对比。叠条形图可以分为一般堆叠条形图和百分比堆叠条形图。需要注意的一点是,如果一个柱子上的分类太多会导致数据很难进行区分对比,不利于数据的展示和观察。三维堆积条形图以三维格式显示水平矩形,而不以三维格式显示数据。
堆积条形图

适用场景:

  • 部分与整体的关系:当您希望展示每个主类别中各个子类别的比例以及它们如何共同构成整体时,堆积条形图是一个很好的选择。例如,分析某个市场中不同品牌的市场份额分布;
  • 数据分类对比:如果需要在同一个图表中比较多个分类,并且了解每个分类内部不同子类别的贡献情况,堆积条形图可以帮助清晰地传达这些信息。比如,按地区分析公司的销售业绩,同时细分产品类型;
  • 趋势分析:对于显示随时间变化的趋势,特别是当您想要同时展示总体趋势和组成部分的变化时,堆积条形图能够提供有价值的洞察;
  • 简化复杂信息:当面对的数据结构较为复杂但希望通过一种简洁的方式呈现时,堆积条形图可以通过其布局帮助简化这种复杂性,使得观众更容易理解数据的整体概览。

不适用场景:

  • 子类别过多的情况:如果一个主类别下有太多的子类别,堆积条形图可能会变得难以阅读和理解,因为过多的颜色或段落会使图表显得拥挤;
  • 比较子类别间的差异:虽然堆积条形图适合展示部分与整体的关系,但它并不利于精确比较不同主类别之间某个特定子类别的数值大小,尤其是当子类别的长度差异不大时;
  • 数据分布情况的展示:对于需要详细展示连续型数据分布情况的情形,如年龄分布、测试成绩等,直方图通常是比堆积条形图更好的选择;
  • 当需要强调顺序或排名时:如果您的目标是展示数据的排序或排名,那么其他类型的图表,如简单条形图或柱状图,可能更适合,因为堆积条形图更侧重于展示比例而非顺序。

3.百分比堆积条形图和三维百分比堆积条形图

百分比堆叠条形图是一种特殊类型的堆叠条形图,它将每个主类别的各个子类别显示为占该主类别总量的百分比。这种方式强调的是各子类别在整体中的相对比例,而不是绝对数值。百分比堆叠条形图上柱子的各个层代表的是该类别数据占该分组总体数据的百分比。百分比堆叠条形图不适用于对比不同分组内同个分类的数据大小或者对比各分组总数的大小。三维百分比堆积条形图表以三维格式显示水平矩形,而不以三维格式显示数据。
百分比堆积条形图

适用场景:

  • 强调部分对整体的贡献:当您想要展示每个主类别中不同子类别的占比情况,并且重点关注这些子类别如何构成整体时,百分比堆叠条形图非常有用。例如,分析市场中不同品牌的市场份额分布;
  • 比较类别间子类别的组成差异:如果目的是比较多个主类别之间子类别的构成差异,而不关心具体的数值大小,百分比堆叠条形图可以清晰地展示这种对比。比如,不同地区产品销售结构的对比;
  • 显示随时间变化的比例趋势:对于需要展示随时间变化的数据类别内各子类别的比例变化情况,百分比堆叠条形图能够有效地揭示总体趋势以及组成部分的变化;
  • 数据标准化需求:当数据量级差异大但希望统一标准进行比较时(即将所有主类别的总值都设为100%),百分比堆叠条形图能有效消除因总量差异带来的视觉误导,专注于比例关系。

不适用场景:

  • 需要精确数值对比的情况:由于百分比堆叠条形图只展示了比例而非具体数值,因此不适合用于需要精确了解各子类别具体数值的场合;
  • 子类别过多或过于复杂的情况:如果一个主类别下包含太多的子类别,图表可能会变得难以阅读和理解,因为过多的颜色和段落会使图表显得拥挤且复杂;
  • 当关注点在于总量对比时:如果您更关心的是各主类别之间的总量对比而非内部构成,那么其他类型的图表如简单条形图或柱状图可能更为合适;
  • 数据分布情况展示:对于需要详细展示连续型数据分布情况的情形,如年龄分布、测试成绩等,直方图通常是比百分比堆叠条形图更好的选择。

4.水平圆柱图、圆锥图和棱锥图

水平圆柱图、圆锥图和棱锥图可以使用为矩形条形图提供的簇状图、堆积图和百分比堆积图,并且它们以完全相同的方式显示和比较数据。唯一的区别是这些图表类型显示圆柱、圆锥和棱锥形状而不是水平矩形。
圆柱图

5.旋风图(金字塔图)

旋风图是条形图的一种变体,也被称之为蝴蝶图,因为图表两侧像一对翅膀一样,是一种背靠背的条形图,这种图表多用于某个事物的两种不同指标对比,如同一个年龄段两种产品的用户比例,同一种产品在接连两年的销量或者利润等指标。
人口金字塔

适用场景:

  • 人口统计分析:这是金字塔图最经典的使用场景,用于展示不同年龄段男性和女性的数量或比例,有助于了解人口结构及变化趋势;
  • 对比两组数据:当需要直观地比较两组具有可比性的数据时,例如不同市场细分、产品类型的销售表现等,金字塔图可以清晰地显示各组内的差异以及组间的对比;
  • 健康与社会研究:在健康和社会科学研究中,用来展示疾病发病率、死亡率等指标在不同性别或不同年龄段中的分布情况,帮助识别潜在的趋势或问题;
  • 教育与就业分析:可用于分析教育成就、就业率或其他社会经济指标在不同性别或种族之间的差异,以支持政策制定和资源分配。

不适用场景:

  • 数据复杂度高:如果数据集包含过多的分类或者子类别,金字塔图可能会变得难以阅读和理解,因为过多的信息会使图表显得杂乱无章;
  • 需要详细数值的情况:金字塔图更适合展示比例和趋势而非精确数值。如果分析的重点在于获取具体数值而不是相对比例,可能需要选择其他形式的图表,如表格或普通条形图;
  • 非二分群体对比:金字塔图的设计初衷是为了对比两个明确区分的群体(如男性与女性)。如果需要比较三个或更多个群体,金字塔图就不太合适了,此时考虑使用分组条形图或堆叠条形图会更加有效;
  • 展示连续数据分布:对于需要展示连续型数据分布情况的情形,比如测试分数分布或身高分布,直方图是更合适的工具,因为它能够更好地展现数据的分布特征。

6.甘特图

甘特图 | Atlassian
甘特图 (zhihu.com)
甘特图(Gantt Chart) 是一种条形图,又被称之为条状图、横道图,广泛用于项目管理中,以直观地展示项目的计划与进度。它通过水平的条形来表示每个任务的开始时间、持续时间和结束时间,使得项目团队成员可以清晰地看到各项任务的时间安排及其相互之间的关系。甘特图由Henry L. Gantt在1910年代开发,自那时以来已经成为项目管理的重要工具。

主要特点:

  • 时间线:甘特图沿着X轴显示时间线,通常从项目的开始日期延伸到结束日期。Y轴则列出所有的任务或活动;
  • 任务条形:每个任务用一个横向的条形表示,其长度对应于任务的持续时间,位置反映了任务的开始和结束日期;
  • 依赖关系:可以通过连接线或其他标记方式来展示任务之间的依赖关系,如前置任务(Predecessor)和后续任务(Successor),有助于理解任务间的逻辑顺序;
  • 里程碑:关键的检查点或重要事件(称为里程碑)可以用特殊的符号(如菱形)标注在图表上,以便于识别重要的阶段性成果。

甘特图

适用场景:

  • 项目规划:当您需要详细规划一个项目的各个阶段和具体任务时,甘特图是一个理想的选择。它可以帮助项目经理合理分配资源并确保所有任务都按计划进行;
  • 进度跟踪:甘特图不仅可用于规划,还可以用来实时监控项目的进展。通过更新实际完成情况,可以清楚地看到哪些任务提前完成、按时完成或延迟完成;
  • 团队协作:对于涉及多个团队成员或多部门合作的项目,甘特图能够清晰地显示每个人或小组负责的任务以及这些任务如何与其他任务相联系,促进更好的沟通与协调;
  • 资源管理:甘特图也可以帮助管理者了解资源的使用情况,避免资源过度分配或闲置,从而提高资源利用效率。

不适用场景:

  • 高度动态变化的项目:如果项目的需求和范围频繁变动,维护甘特图可能会变得非常耗时且难以保持最新状态。在这种情况下,敏捷方法中的看板(Kanban Board)可能更适合;
  • 小规模简单项目:对于非常小且简单的项目,创建和维护甘特图可能会显得过于复杂和不必要。在这种情况下,简单的待办事项列表或者口头沟通就足够了;
  • 缺乏明确时间框架的项目:如果项目没有明确的时间框架或者任务的具体持续时间难以确定,那么甘特图的效果会大打折扣。此时,可能需要先进行更详细的规划工作;
  • 复杂的多维度数据分析:尽管甘特图擅长于展示时间序列和任务依赖关系,但它不适合用于复杂的多维度数据分析。对于这种需求,其他类型的图表如矩阵图或热力图可能更加合适。

7.瀑布图

都说瀑布图难做,其实只是你没理解原理 - 知乎 (zhihu.com)
什么是瀑布图?瀑布图该怎么做? - 知乎 (zhihu.com)
瀑布图(Waterfall Chart) 是一种特殊的条形图,用于展示数据如何随一系列步骤或事件逐步累积变化。它特别适用于解释初始值如何通过一系列正值和负值的影响最终达到结束值的过程。瀑布图通常用来显示财务分析中的收入与支出、利润计算、项目进度的增减情况等。

主要特点:

  • 累积效果:瀑布图能够清晰地展示数值从一个状态到另一个状态的变化过程,包括每个中间步骤对最终结果的具体影响;
  • 连接线:在图表中,使用线条将各个柱状图连接起来,以直观地表示数据的流动和累计效果;
  • 正负值区分:瀑布图通常用不同颜色区分正值(如收入、增加)和负值(如成本、减少),使得读者可以轻松识别出哪些因素增加了总值,哪些因素减少了总值。

结构组成:

  • 起始值:通常表示项目的初始状态或基数;
  • 增量和减量:这些是导致起始值发生变化的因素,可以用正数表示增加的部分,用负数表示减少的部分;
  • 累计值:每一步骤后的累计结果,直到最后得到最终值;
  • 基线:为了更好地理解数值的变化,通常会有一条水平线作为参考点(通常是0或者起始值)。

瀑布图

适用场景:

  • 财务分析:当需要详细说明收入、成本及利润之间的关系时,瀑布图是一个理想的选择。例如,在年度财务报告中,可以通过瀑布图展示公司从年初到年末的盈利变化过程;
  • 绩效评估:对于绩效指标的变动分析,瀑布图可以帮助管理者了解各项措施对整体业绩的具体贡献或负面影响。例如,在销售部门,可以用来展示促销活动前后销售额的变化;
  • 成本控制:在预算管理和成本控制过程中,瀑布图可用于展示实际花费相对于预算限额的变化情况,并帮助识别超支的原因;
  • 项目管理:在项目进度跟踪中,瀑布图可以帮助团队成员了解项目进度的变化及其背后的原因。例如,展示某个阶段的任务完成情况对整个项目时间表的影响。

不适用场景:

  • 复杂多变量分析:如果需要同时考虑多个变量之间的相互作用,瀑布图可能不是最佳选择。它的设计初衷是为了聚焦于单一维度的数据变化过程,因此不适合复杂的多维数据分析任务;
  • 数据过于密集:当数据集包含大量细小的变化项时,瀑布图可能会变得难以阅读和理解。过多的条形和连接线会使图表显得杂乱无章,影响信息传达的有效性;
  • 需要精确数值对比:尽管瀑布图擅长于展示数值的变化过程,但它并不适合用于精确比较具体数值之间的差异。如果您需要进行详细的数值对比,柱状图、折线图或其他类型的图表可能更为合适;
  • 小样本量数据集:在处理样本量较小的数据集时,使用瀑布图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

(二)直方图

直方图(统计报告图)百度百科 (baidu.com)
直方图(Histogram)是一种用于展示连续型数据分布情况的统计图表,又被称之为称质量分布图。它通过将数据分割成一系列相邻的区间(也称为“bins”或“buckets”),然后计算每个区间内数据点的数量(频数),以此来表示数据的分布特征。直方图可以帮助我们快速了解数据的集中趋势、分散程度以及是否存在异常值或极端值。直方图包括频数分布直方图区域直方图两种。

直方图的主要特点包括:

  • 数据分组:直方图通过对原始数据进行分组,将连续的数据划分为若干个区间,使得我们可以观察到数据在不同区间内的频率分布;
  • 无间隔的矩形条:每个区间用一个矩形条表示,矩形条的高度代表该区间内数据出现的次数(频数),宽度则代表区间的范围。所有矩形条之间没有间隔,以显示数据的连续性;
  • 展示分布模式:直方图能够有效地展示数据的分布模式,如正态分布、偏斜分布、双峰分布等;
  • 帮助识别异常:通过观察直方图的形状,可以很容易地发现数据中的异常值或极端值,这些可能指示了数据收集过程中的错误或者特殊现象。

描绘条形图的要素有3个:

  • 组数:把数据分成几组,指导性的经验是将数据分成 5~10 组;
  • 组宽度:通常来说,每组的宽度是一致的。组数和组宽度的选择就不是独立决定的,一个经验标准是: 近似组宽度 = (最大值 − 最小值) / 组数 近似组宽度=(最大值 - 最小值)/组数 近似组宽度=(最大值最小值)/组数,然后根据四舍五入确定初步的近似组宽度,之后根据数据的状况进行调整;
  • 组限:分为组下限(进入该组的最小可能数据)和组上限(进入该组的最大可能数据),并且一个数据只能在一个组限内。

条形图与直方图的区别是:

  • ① 条形图是用条形的高度表示频数的大小,而直方图实际上是用长方形的面积表示频数,当长方形的宽相等的时候可以用矩形的高表示频数;
  • ② 条形图中,横轴上的数据是孤立的,是一个具体的数据,而直方图中,横轴上的数据是连续的,是一个范围;
  • ③ 条形图中,各长方形之间有空隙,而直方图中,各长方形是靠在一起的。

1.频数分布直方图

频数分布直方图是属于直方图的一种,频数分布直方图是指在统计数据时,按照频数分布表,在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数。
频数分布直方图

适用场景:

  • 数据分布分析:当您需要了解一组数据的整体分布情况时,如其形状(正态分布、偏态分布)、中心趋势(均值、中位数)、离散程度以及是否存在异常值或极端值;
  • 大量数值型数据可视化:对于大量连续数值型数据,直方图能够有效地总结和展示数据的分布模式,帮助快速识别数据的基本特征和潜在问题;
  • 比较不同数据集的分布:通过绘制多个直方图,可以直观地比较两个或更多个数据集的分布情况,比如对比不同年份的考试成绩分布;
  • 质量控制和过程改进:在制造业等领域,使用直方图来监控生产过程中的变量(如零件尺寸),以确保它们符合特定的标准,并识别任何可能导致质量问题的趋势或偏差。

不适用场景:

  • 分类数据:如果您的数据是分类数据(例如颜色、品牌名称等),而不是连续数值型数据,则直方图不是合适的选择。此时,条形图或饼图可能更适合作为数据展示工具;
  • 小样本数据集:对于样本量很小的数据集,直方图可能无法提供足够的信息来准确反映数据的真实分布,且容易导致误导性的结论。在这种情况下,考虑使用其他形式的图表,如点图或者直接列出数据;
  • 精确数值比较:虽然直方图擅长显示数据分布的整体形态,但它不适合用于精确比较具体数值之间的差异。如果您需要对特定数值进行精确对比,那么表格或其他类型的图表(如折线图)可能更为合适;
  • 高度细化的数据分析需求:当需要深入分析数据内部的结构或关系时,直方图提供的信息可能过于概括。在这种情形下,可能需要采用更复杂的统计方法或图表类型,如箱形图、散点图等。

2.区域直方图

区域直方图 (Spatial Analyst)—ArcMap | 文档
区域直方图是属于直方图的一种,是一种由一系列高度不等的纵向条纹或线段表示数据分布的情况的统计图表。区域直方图一般用纵轴表示分布情况横轴表示数据类型,是一种数值数据分布的精确图形表示。可以通过区域直方图对一个数据集中的值在另一个数据集类中的频数分布进行研究。例如,土地利用类中的坡度分布、高程类中的降雨分布或警务区附近的犯罪分布。

适用场景:

  • 地理数据分析:当需要分析和展示某一特定地理区域内数据的分布情况时,例如不同城市的犯罪率、各地区的平均房价等。通过将直方图应用于地理空间,可以直观地看到哪些区域的数据值较高或较低;
  • 环境科学研究:在环境科学中,用于展示污染物浓度在不同地理位置上的分布情况,有助于识别污染热点地区及其影响范围;
  • 市场分析:对于零售商来说,了解其产品销售量在不同地区的分布可以帮助制定更有效的市场策略。区域直方图能够清晰显示哪些区域是销售热点,哪些区域表现不佳;
  • 公共卫生:在公共卫生领域,可用于展示疾病发病率在不同地理区域的分布情况,为资源分配提供依据,并帮助识别高风险区域。

不适用场景:

  • 非空间相关数据:如果数据没有明显的地理或空间关联性,则使用区域直方图并不合适。例如,比较不同类型的产品销售额可能更适合用普通条形图或柱状图来表示;
  • 数据过于稀疏:在某些情况下,如果地理区域内数据点非常少,那么生成的区域直方图可能无法准确反映实际的数据分布,甚至可能导致误导性的结论;
  • 需要详细数值对比:当分析的重点在于获取具体数值而非相对比例或趋势时,区域直方图可能不是最佳选择。在这种情况下,表格或其他形式的精确数值报告会更加有效;
  • 复杂的空间关系:对于那些需要深入探讨复杂空间关系(如网络路径分析、地形影响等)的情况,简单的区域直方图可能无法满足需求,这时需要更高级的空间分析工具和技术。

3.南丁格尔玫瑰图

南丁格尔玫瑰图(适用场景|应用示例|历史来源) - 知乎 (zhihu.com)
南丁格尔玫瑰图,又名鸡冠花图、极坐标区域图,是一种圆形的直方图,是由弗罗伦斯·南丁格尔所发明,用以表达军医院季节性的死亡率的一种图表。由于半径和面积的关系是平方的关系,玫瑰图会将数据的比例大小夸大,尤其适合对比大小相近的数值,同时由于圆形有周期的特性,所以玫瑰图也适用于表示一个周期内的时间概念,比如星期、月份。
南丁格尔玫瑰图

适用场景:

  • 强调比例和相对大小:当您想要强调数据之间的相对大小或比例时,南丁格尔玫瑰图可以通过其独特的视觉效果突出显示这些差异。例如,在市场分析中比较不同产品类别的销售额占比;
  • 展示周期性数据:如果您的数据具有周期性特征(如季节性、月份等),南丁格尔玫瑰图可以很好地展现这些周期内的变化趋势。例如,展示一年中每个月份的降雨量或游客数量;
  • 数据分类清晰且数量有限:对于分类明确且类别数量适中的数据集来说,南丁格尔玫瑰图能够提供一个直观的视角来观察每个类别的重要性或贡献度。比如,分析不同年龄段的人口构成;
  • 吸引注意力的数据呈现:由于其独特的外观,南丁格尔玫瑰图在报告或演示文稿中能吸引观众的注意,适合用于需要强烈视觉冲击力的场合。

不适用场景:

  • 大量类别或复杂数据集:如果数据包含大量的类别或者非常复杂,南丁格尔玫瑰图可能会变得难以阅读和理解。过多的扇区会使图表显得杂乱无章,降低信息传达的有效性;
  • 需要精确数值对比:尽管南丁格尔玫瑰图擅长于展示比例关系,但它不适合用来进行精确的数值对比。由于人类视觉对面积而非长度更为敏感,因此在比较具体数值时可能不够准确;
  • 数据值接近的情况:当各个类别的数值相差不大时,南丁格尔玫瑰图可能无法有效地区分这些细微差别,因为较小的变化在圆形布局下不易察觉;
  • 动态数据展示:对于随时间动态变化的数据,南丁格尔玫瑰图可能不是最佳选择。在这种情况下,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适。

(三)折线图

折线图 - 知乎 (zhihu.com)
折线图是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。数据是递增还是递减增减的速率增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来。常见作用汇总如下:

  • 数据趋势对比分析:探究数据随着时间的趋势变化关系;
  • 数据周期变化分析:探究数据随着时间是否呈现一定的周期波动规律;
  • 数据异常分析:查看数据某个时间点的异常值、波峰、波谷。

单条折线图

适用场景:

  • 展示趋势变化:当需要展示数据随时间的变化趋势时,折线图是一个理想的选择。它可以帮助观察到上升、下降或是周期性的模式。例如,股票市场的价格变动、年度销售数据等;
  • 比较多个数据集的趋势:折线图可以轻松地在同一图表上绘制多条线来比较不同数据集之间的趋势。这对于分析不同产品系列的销售情况或对比不同地区的经济增长率非常有用;
  • 显示连续性数据:对于连续型变量的数据(如温度、湿度),折线图能够很好地表示这些变量在一段时间内的变化;
  • 预测未来走势:基于现有数据的趋势,折线图可用于推测未来的可能走向,尤其是在结合统计模型的情况下。

不适用场景:

  • 离散数据或类别数据:如果您的数据是离散的或者属于不同的类别,并不适合使用折线图来表示。此时,柱状图或饼图可能是更好的选择;
  • 小样本数据集:当样本量较小的时候,折线图可能会误导观众对趋势的理解。在这种情况下,直接展示原始数据点可能更为合适;
  • 复杂的数据关系:如果数据间的关系较为复杂,包含多个维度或层次的信息,折线图可能无法有效地传达所有信息。更复杂的图表类型,如热力图或多维散点图,可能更适合;
  • 精确数值对比:虽然折线图适合展示趋势,但当需要精确比较具体数值时,它并不是最佳选择。在这种情况下,表格或其他类型的图表(如条形图)可能更能满足需求。

1.百分比堆叠折线图

百分比堆叠折线图是一种特殊类型的图表,它用来展示多个数据系列中每个系列占总体的比例随时间或其他连续变量的变化情况。在这种图表中,所有系列的数据点在每个时间点或分类上相加等于 100%。每条折线代表一个类别,并且该类别的值相对于整体的百分比变化被描绘出来。这种图表非常适合用于观察各部分如何随着时间(或另一个连续变量)推移而增减,以及它们在整个总量中的相对位置。
百分比堆叠折线图

适用场景:

  • 成分分析:当您需要展示不同类别在整体中的比例变化趋势时,百分比堆叠折线图是一个很好的选择。例如,在市场分析中,可以用来显示不同品牌或产品类型随时间的市场份额变化;
  • 相对贡献评估:这种图表有助于评估各个组成部分对整体的相对贡献度,尤其是在关注的是各部分的比例而非绝对数值的情况下。它可以清晰地反映出每个部分的增长或减少趋势;
  • 趋势识别:百分比堆叠折线图能够帮助识别出哪些部分正在成为更重要的组成部分,以及这些变化如何影响整体结构。这对于战略规划和决策制定特别有用;
  • 比较不同时间段的表现:对于想要比较不同时期内各部分所占比例的变化情况,该类型的图表能提供直观的理解。

不适用场景:

  • 绝对数值的展示:由于百分比堆叠折线图强调的是比例关系而不是具体的数值大小,因此它不适合用于直接比较不同组间的绝对数值差异。如果绝对数量是关键指标,则应考虑使用其他类型的图表,如普通折线图或柱状图;
  • 数据复杂度过高:如果有太多的分类或者数据过于复杂,可能会导致图表难以阅读和理解。过多的线条堆叠在一起会使图表显得杂乱无章,影响信息传达的有效性;
  • 小样本量数据集:对于样本量较小的数据集,使用百分比堆叠折线图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,直接展示原始数据点或采用更适合小样本量的图表类型会更合适;
  • 快速变化的数据:如果数据波动频繁且剧烈,百分比堆叠折线图可能不是最佳选择,因为快速的变化会使图表难以解读,难以明确区分每个部分的趋势。

2.面积图

面积图又称之为区域图,面积图是在折线图的基础上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,这样一个填充区域我们叫做面积,不同颜色的填充可以更好的突出趋势信息。面积图强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。面积图能够直观地将累计的数据,呈现给读者。面积图最常用于表现趋势和关系,而不是传达特定的值。面积图分为三种:基本面积图堆叠面积图百分比堆叠面积图
基本面积图

适用场景:

  • 展示累积总量的趋势:面积图非常适合用来展示随时间或其他连续变量变化的数据累积总量。例如,可以用来表示公司历年累计利润的变化趋势;
  • 比较多个数据系列的相对贡献:当需要同时展示多个数据系列,并且关注每个系列对整体的贡献时,堆叠面积图是一个很好的选择。这有助于观察各部分如何共同构成一个整体;
  • 强调数据的整体趋势和组成部分:面积图不仅能够显示总体趋势,还能通过颜色区分来突出显示各个组成部分的变化情况。这对于理解复杂的数据模式非常有用;
  • 可视化周期性波动:对于具有季节性或其他周期性特征的数据集,面积图可以帮助识别这些周期性的波动及其对整体趋势的影响。

不适用场景:

  • 精确数值对比:由于面积图主要用于展示趋势和比例关系,它不适合用于精确地比较不同数据点的具体数值。如果需要进行精确的数值对比,柱状图或条形图可能更为合适;
  • 数据过于复杂或类别过多:如果数据集包含太多类别或者数据过于复杂,面积图可能会变得难以阅读和理解。过多的颜色和线条会使图表显得杂乱无章,影响信息传达的有效性;
  • 快速变化的数据:对于数据波动频繁且剧烈的情况,面积图可能不是最佳选择,因为快速的变化会使得图表难以解读,难以明确区分每个部分的趋势;
  • 小样本量数据集:在处理样本量较小的数据集时,使用面积图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

3.堆叠面积图

堆叠面积图(Stacked Area Chart)是一种用于可视化多个数据系列随时间或其他连续变量变化的数据图表。它通过将每个数据系列的值堆叠在一起,使得每一系列不仅展示其自身的数值变化,同时也展示了该系列对整体总量的贡献。堆叠面积图和基本面积图一样,唯一的区别就是图上每一个数据集的起点不同,起点是基于前一个数据集的,用于显示每个数值所占大小随时间或类别变化的趋势线,这种图表非常适合用来展示各部分如何共同构成一个整体,并且可以清晰地看出各个部分随时间或另一个维度的变化趋势。

堆叠面积图的主要特点包括:

  • 分层显示:每个数据系列在图表中以不同颜色表示,并堆叠在前一个系列之上,形成一个连续的区域。这使得用户可以很容易地看到每个系列随时间或其他维度的变化,以及它们对整体总量的贡献;
  • 累积效果:顶部的线条代表所有系列的累积总和,而每一层之间的空间则表示单个系列的值。这样不仅可以观察到总体的趋势,还可以分析各组成部分的变化情况;
  • 强调比例与趋势:堆叠面积图特别擅长于展示数据的比例关系及其随时间的变化趋势。它可以有效地帮助观众理解数据的整体结构以及各部分的重要性。

堆叠面积图

适用场景:

  • 展示累积总量的趋势:当您需要展示随时间或其他连续变量变化的数据累积总量时,堆叠面积图非常有用。例如,它可以用来显示公司历年累计利润的变化趋势,同时也能展示各个业务部门对总利润的贡献;
  • 比较多个数据系列的相对贡献:堆叠面积图适合用来同时展示多个数据系列,并且可以清晰地看出每个系列对整体的贡献比例。这对于分析不同产品线、市场区域或任何其他分类下的表现特别有帮助;
  • 强调各部分与整体的关系:这种图表不仅能够显示总体趋势,还能通过颜色区分来突出显示各个组成部分的变化情况。这有助于理解各个部分如何共同构成一个整体,并观察它们各自的动态变化;
  • 可视化周期性波动和趋势:对于具有季节性或其他周期性特征的数据集,堆叠面积图可以帮助识别这些周期性的波动及其对整体趋势的影响,如年度销售数据中的季节性变化。

不适用场景:

  • 精确数值对比:由于堆叠面积图主要用于展示趋势和比例关系,它不适合用于精确地比较不同数据点的具体数值。如果需要进行精确的数值对比,柱状图或条形图可能更为合适;
  • 数据过于复杂或类别过多:如果数据集包含太多类别或者数据过于复杂,堆叠面积图可能会变得难以阅读和理解。过多的颜色和线条会使图表显得杂乱无章,影响信息传达的有效性;
  • 快速变化的数据:对于数据波动频繁且剧烈的情况,堆叠面积图可能不是最佳选择,因为快速的变化会使得图表难以解读,难以明确区分每个部分的趋势;
  • 小样本量数据集:在处理样本量较小的数据集时,使用堆叠面积图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

4.百分比堆叠面积图

百分比堆叠面积图(Percentage Stacked Area Chart) 是一种特殊的堆叠面积图,它将每个数据系列在每一个时间点或分类上的值标准化为占总体的百分比。这意味着,在任何给定的时间点上,所有数据系列的百分比加起来总是等于 100%。这种图表主要用于展示各个组成部分相对于整体的比例变化趋势,而不是它们的绝对数值。

主要特点:

  • 比例而非绝对值:百分比堆叠面积图关注的是各部分占整体的比例,而不是具体的数值大小。这使得它可以有效地展示各部分随时间或其他连续变量的变化趋势;
  • 强调相对贡献:通过显示各部分占总体的百分比,这种图表能够突出显示每个组成部分对整体的相对贡献如何随时间或另一个维度变化;
  • 累积效果:尽管显示的是百分比,顶部的线条仍然代表了 100%,但不再表示实际的累积总数。相反,它展示了所有类别总和始终为 100% 这一事实。

百分比堆叠面积图

适用场景:

  • 成分分析:当您需要展示不同类别在整体中的比例变化趋势时,百分比堆叠面积图是一个很好的选择。例如,在市场分析中,可以用来显示不同品牌或产品类型随时间的市场份额变化;
  • 相对贡献评估:这种图表有助于评估各个组成部分对整体的相对贡献度,尤其是在关注的是各部分的比例而非绝对数值的情况下。它可以清晰地反映出每个部分的增长或减少趋势;
  • 趋势识别:百分比堆叠面积图能够帮助识别出哪些部分正在成为更重要的组成部分,以及这些变化如何影响整体结构。这对于战略规划和决策制定特别有用;
  • 比较不同时间段的表现:对于想要比较不同时期内各部分所占比例的变化情况,该类型的图表能提供直观的理解。

不适用场景:

  • 绝对数值的展示:由于百分比堆叠面积图强调的是比例关系而不是具体的数值大小,因此它不适合用于直接比较不同组间的绝对数值差异。如果绝对数量是关键指标,则应考虑使用其他类型的图表,如普通折线图或柱状图;
  • 数据复杂度过高:如果有太多的分类或者数据过于复杂,可能会导致图表难以阅读和理解。过多的颜色和线条会使图表显得杂乱无章,影响信息传达的有效性;
  • 小样本量数据集:对于样本量较小的数据集,使用百分比堆叠面积图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,直接展示原始数据点或采用更适合小样本量的图表类型会更合适;
  • 快速变化的数据:如果数据波动频繁且剧烈,百分比堆叠面积图可能不是最佳选择,因为快速的变化会使图表难以解读,难以明确区分每个部分的趋势。

5.阶梯线图

阶梯线图(Step Line Chart)又称方波图, 是一种特殊类型的折线图,它通过使用垂直和水平线段来连接数据点,形成类似阶梯的形状,而不是直接用直线连接这些点。这种图表主要用于表示数据在特定时间点或区间内的突变情况,强调数据值的变化发生在区间的开始或结束时。

主要特点:

  • 阶梯状连接:与普通折线图不同,阶梯线图不是用斜线直接连接相邻的数据点,而是先垂直后水平地连接两点,形成一个“阶梯”。这表明在一个时间段内,数据值保持不变,直到下一个数据点才发生改变;
  • 强调变化时刻:阶梯线图特别适合展示那些在特定时刻发生显著变化的数据集,如价格调整、政策变更等。它可以清楚地标记出这些变化发生的精确时间点;
  • 区间稳定性:由于数据值在两个数据点之间的整个区间内保持恒定,阶梯线图能够很好地展示数据在各个区间内的稳定性以及何时发生变化。

阶梯线图

适用场景:

  • 强调离散事件的影响:当您需要突出显示某些特定时刻发生的重大变化,并且希望明确这些变化的具体时间点时,阶梯线图是一个很好的选择。例如,在金融领域,可以用来表示利率调整的时间点及其影响;
  • 展示固定区间内的稳定值:如果您的数据在一定时间内是固定的,只有在某些特定时刻才会更新或改变,那么阶梯线图可以帮助观众清晰地看到这些变化前后的稳定期。例如,电价根据不同的时间段进行调整的情况;
  • 数据收集间隔不一致的情况:当数据采集的时间间隔不一致时,阶梯线图可以避免给观众造成误导,因为它不会像普通折线图那样通过插值来平滑过渡;
  • 突出政策或规则变更的影响:对于展示政策、法规或其他规则变更对某一指标的影响,阶梯线图能够有效地传达出这些变化的具体时间和效果。

不适用场景:

  • 连续变化的数据:如果您的数据是连续变化的,而非在特定时间点发生突变,那么阶梯线图可能不是最佳选择。在这种情况下,普通的折线图更能准确反映数据的趋势;
  • 需要精确数值对比:尽管阶梯线图擅长于展示变化时刻,但其视觉特性可能不适合用于精确比较具体数值之间的差异。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 复杂数据关系:如果数据间的关系非常复杂,包含多个维度或层次的信息,阶梯线图可能无法有效地传达所有信息。更复杂的图表类型,如热力图或多维散点图,可能更适合此类数据。

(四)饼图

饼图(Pie Chart) 是一种圆形统计图表,它将一个圆分割成多个扇区,每个扇区代表数据集中的一个类别。这些扇区的大小与其所代表的数值占总体的比例成正比,因此饼图非常适合用来展示各部分相对于整体的关系。饼图通常用于表示百分比数据,所有扇区加起来总和为100%。

主要特点:

  • 直观的比例展示:饼图通过扇区的面积大小直观地展示了各个类别在整体中所占的比例,使得观众可以快速理解数据的整体分布情况;
  • 简单易懂:对于少量类别的数据集,饼图提供了一种非常直观且易于理解的方式来展示数据,适合非专业观众阅读;
  • 单一维度:饼图主要用于展示单个维度的数据分布,即不同类别的占比情况,而不适合用于展示多维度或复杂关系的数据。

饼图

适用场景:

  • 展示比例关系:当您需要展示数据集中各部分相对于整体的比例时,饼图是一个理想的选择。例如,可以用饼图来显示公司市场份额、预算分配等;
  • 简单分类数据:如果您的数据集包含的是少数几个明确分类,并且关注的是这些分类之间的相对大小而非具体数值,那么饼图可以帮助观众快速理解各部分的重要性;
  • 强调部分与整体的关系:当目标是突出显示某个特定部分在整个数据集中的重要性时,饼图可以通过将其与其他部分对比来达到这一目的。例如,在财务报告中强调某一成本项目在总成本中的比重。

不适用场景:

  • 多类别数据:当数据集包含过多类别时,饼图会变得难以阅读和理解。太多的扇区会使图表显得杂乱无章,影响信息传达的有效性。在这种情况下,条形图或其他类型的图表可能更为合适;
  • 需要精确数值对比:尽管饼图擅长展示比例关系,但它不适合用于精确比较不同类别的具体数值。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 数据变化趋势:饼图不适用于展示数据随时间的变化趋势。对于这种需求,折线图或面积图等更能准确反映数据的时间序列变化。

1.旭日图

Excel制作旭日图 - 哔哩哔哩 (bilibili.com)
旭日图:强大的层级关系展示图表 (baidu.com)
旭日图的作用 - 知乎 (zhihu.com)
旭日图(Sunburst Chart) 是一种分层数据可视化工具,它通过一系列嵌套的环形扇区来表示数据的层次结构。每个扇区的大小和颜色可以用来编码不同的数值或类别信息,使得旭日图非常适合展示复杂的层级关系及其在整体中的占比情况。由于其独特的视觉效果,旭日图能够有效地揭示多层次的数据结构,帮助观众理解不同层级之间的比例关系。

主要特点:

  • 层次结构展示:旭日图通过从中心向外扩展的多个层级来展示数据的层次结构。最内层通常代表顶级分类,而外层则展示子分类;
  • 比例关系:每个扇区的大小与其所代表的数值成正比,这样就可以直观地看出各个部分在整个数据集中的相对重要性;
  • 颜色编码:不同颜色用于区分不同的类别或层级,使得图表更加清晰易读,并能突出显示特定的信息。

旭日图

适用场景:

  • 层次结构数据展示:当您需要展示具有层次结构的数据时,旭日图是一个理想的选择。它可以清晰地表示不同层级之间的关系及其在整体中的占比。例如,在组织结构分析中,可以用来显示各部门及其子部门的人数分布;
  • 部分与整体的关系:旭日图通过不同大小的扇区来表示各部分占整体的比例,非常适合用来展示各个组成部分如何构成一个更大的整体。例如,可以用它来展示市场细分中的各类别及其子类别的市场份额;
  • 多级分类数据的可视化:对于包含多个层级分类的数据集,旭日图能够有效地展示每一层分类及其内部细节,帮助观众理解复杂的数据结构。例如,产品类别及其下细分的产品线和具体产品的销售情况;
  • 强调关键部分的重要性:旭日图可以通过突出显示某些重要的扇区来强调其在整个数据集中的重要/XMLSchema定义不适用于此内容类型。

不适用场景:

  • 精确数值对比:由于旭日图主要用于展示比例关系而不是具体的数值大小,因此它不适合用于直接比较不同组间的绝对数值差异。如果绝对数量是关键指标,则应考虑使用其他类型的图表,如柱状图或条形图;
  • 过多层级或类别:如果数据集包含太多的层级或类别,旭日图可能会变得难以阅读和理解。过多的颜色和线条会使图表显得杂乱无章,影响信息传达的有效性。在这种情况下,可能更适合使用树状图或其他形式的分层图表;
  • 动态数据展示:对于随时间动态变化的数据,旭日图可能不是最佳选择。在这种情况下,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适;
  • 简单数据集:如果数据集非常简单,只有少量类别且没有明显的层次结构,那么使用旭日图可能会显得过于复杂。此时,简单的饼图或条形图可能更能有效传达信息。

2.环形图

环形图(Donut Chart) 又称之为甜甜圈图、圆环图,是饼图的一种变体,它在中心有一个空洞,因此看起来像一个“环”。与饼图一样,环形图用于展示数据集中各部分的比例关系。每个扇区的大小代表该类别在整体中的占比。通过移除中心部分,环形图可以在视觉上减少对单个比例的关注,使得观众更加注重各部分之间的相对比较。

主要特点:

  • 中心空洞:环形图的主要特征是其中心为空,这不仅让它看起来像是一个甜甜圈,还能够在视觉上减轻对单一比例的关注,从而帮助观众更专注于各个部分之间的相对大小;
  • 比例展示:与饼图类似,环形图通过不同大小的扇区来表示各部分占整体的比例,适合用来展示构成成分的数据集;
  • 额外信息显示:由于有了中心的空白区域,环形图有时会在中心添加额外的信息,如总和、平均值或关键指标等,以增强图表的信息密度。

环形图

适用场景:

  • 展示比例关系:当您需要展示数据集中各部分相对于整体的比例时,环形图是一个理想的选择。例如,在市场分析中,可以用来表示不同品牌或产品类型的市场份额;
  • 简化复杂数据集:如果您的数据集包含的是少数几个明确分类,并且关注的是这些分类之间的相对大小而非具体数值,那么环形图可以帮助观众快速理解各部分的重要性;
  • 强调部分与整体的关系:当目标是突出显示某个特定部分在整个数据集中的重要性时,环形图可以通过将其与其他部分对比来达到这一目的。例如,在财务报告中强调某一成本项目在总成本中的比重;
  • 中心信息补充:利用环形图中心的空白区域,可以添加额外的关键信息,如总计数值、注释或图标,从而增加图表的信息量而不显得拥挤。

不适用场景:

  • 多类别数据:当数据集包含过多类别时,环形图会变得难以阅读和理解。太多的扇区会使图表显得杂乱无章,影响信息传达的有效性。在这种情况下,条形图或其他类型的图表可能更为合适;
  • 需要精确数值对比:尽管环形图擅长展示比例关系,但它不适合用于精确比较不同类别的具体数值。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 数据变化趋势:环形图不适用于展示数据随时间的变化趋势。对于这种需求,折线图或面积图等更能准确反映数据的时间序列变化。

(五)树图

看完这个图表,我直接绿了|矩形|树状图|饼图|树图_网易订阅 (163.com)
矩形树图 - AntV (alipay.com)
树图又称树型图或系统图,是从一个项目出发,展开两个或两个以上分支,然后从每一个分支再继续展开,依此类推,它拥有树干和多个分支,所以很像一棵树,因此命名为树图。树图能将事物或现象分解成树枝状,通过树形结构来展现层级数据的组织关系,以父子层次结构来组织对象,是枚举法的一种表达方式。树图就是把要实现的目的与需要采取的措施或手段,系统地展开,并绘制成图,以明确问题的重点,寻找最佳手段或措施。它利用包含关系表达层次化数据的可视化方法,并且由于其呈现数据时高效的的空间利用率和良好的交互性,受到广泛的应用。树图包括矩形树图分叉树图

1.分叉树图

分叉树图 是一种用于展示数据层次结构的图表类型,它通过节点和分支的形式来表示信息的层级关系。分叉树图通常用于组织结构、分类体系、文件系统等场合,以图形化的方式清晰地展示出各个元素之间的父子关系或从属关系。每个节点代表一个实体(如部门、类别、文件夹等),而连接这些节点的线段则表示它们之间的关系。

主要特点:

  • 层次结构:树图的核心特点是其能够清晰地展示数据的层次结构,从根节点开始逐层展开,直到叶子节点。这种结构非常适合用来展示复杂的层级关系;
  • 节点与边:在树图中,节点表示具体的实体或项目,而边(线条)表示这些节点之间的关系。根节点位于顶部或中心,其他节点按照层级依次排列;
  • 灵活布局:树图可以根据需要采用不同的布局方式,例如横向、纵向或者径向布局。不同的布局方式有助于更好地适应不同的数据集和显示需求。

分叉树图

适用场景:

  • 展示层次结构:当您需要展示具有明确层次结构的数据时,树图是一个理想的选择。例如,在企业组织结构图中,可以清晰地展示各部门及其下属子部门的关系;
  • 分类体系可视化:对于包含多层级分类的数据集,树图能够有效地展示每一层分类及其内部细节,帮助观众理解复杂的数据结构。例如,产品分类体系中的大类、小类及具体产品的归属关系;
  • 决策树分析:在决策分析中,树图可以用来绘制决策树,展示不同决策路径及其可能的结果。这有助于进行风险评估和最佳策略选择;
  • 文件系统导航:树图也常用于展示文件系统的目录结构,用户可以通过树状视图方便地浏览和管理文件夹和文件。

不适用场景:

  • 非层次数据:如果您的数据没有明显的层次结构或从属关系,使用分叉树图可能会导致信息表达不清。在这种情况下,其他类型的图表(如散点图或条形图)可能更为合适;
  • 过于复杂的数据集:当数据集非常庞大且层级过深时,树图可能会变得难以阅读和理解。过多的节点和分支会使图表显得杂乱无章,影响信息传达的有效性;
  • 动态变化的数据:对于随时间动态变化的数据,树图可能不是最佳选择。在这种情况下,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适;
  • 精确数值对比:尽管树图擅长展示层次关系,但它不适合用于精确比较不同节点的具体数值。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择。

2.矩形树图

矩形树图(Treemap) 是一种用于展示层次结构数据的图表类型,它使用嵌套的矩形来表示树状结构。每个矩形的面积大小通常用来表示节点的某个数值属性,这样不仅可以显示数据的层次关系,还可以直观地比较不同节点的相对大小。矩形树图最初由 Ben Shneiderman 在1990年代初提出,目的是为了更有效地利用空间,并以紧凑的方式呈现大型数据集。

矩形树图的特点:

  • 空间利用率高:与传统的树图相比,矩形树图能够更有效地利用屏幕空间,尤其适用于展现大量数据;
  • 面积编码:通过矩形的面积大小来表示数据值,使得用户可以一眼看出各元素的重要性或规模;
  • 颜色编码:通常还会用不同的颜色来区分不同的类别或者显示额外的信息维度;
  • 层次结构清晰:虽然采用了矩形的形式,但仍然能够清晰地展示数据之间的层次关系。

矩形树图

使用场景:

  • 资源分配分析:例如,在公司预算分配中,可以用矩形树图来展示各部门预算及其内部子项目的分配情况;
  • 文件系统可视化:展示磁盘上文件夹和文件的空间占用情况,帮助用户了解哪些文件或目录占用了最多的空间;
  • 市场细分:展示市场中不同细分市场的规模以及它们之间的比例关系;
  • 投资组合管理:对于金融投资领域,可以用来展示投资组合中各类资产的比例分布。

优缺点:

  • 优点:
    • 能够高效地展示大量的层次数据;
    • 直观的面积和颜色编码便于快速理解数据的重要性和分类;
    • 可以有效利用有限的屏幕空间。
  • 缺点:
    • 对于某些用户来说,可能需要一定时间适应这种类型的图表;
    • 当数据量过大时,小的矩形可能会变得难以点击或选择;
    • 如果矩形的长宽比不协调,可能会影响对面积大小的直觉判断。

(六)散点图

散点图(Scatter Plot) 是一种用于展示两个变量之间关系的图表类型。它通过在直角坐标系中绘制点来表示每个数据项,其中每个点的位置由两个变量的值决定:一个变量决定了点的横坐标(X轴),另一个变量决定了点的纵坐标(Y轴)。散点图非常适合用来探索和显示变量之间的相关性、模式或异常值。

主要特点:

  • 变量间的关系:散点图主要用于探索两个连续变量之间的关系。通过观察点的分布模式,可以判断这两个变量是否存在正相关、负相关或无明显相关性;
  • 识别模式与趋势:除了相关性之外,散点图还可以帮助识别数据中的模式、趋势以及潜在的异常值或离群点;
  • 多维度信息:可以通过颜色、大小等额外视觉元素来编码第三个变量的信息,使得散点图能够同时展示更多维度的数据特征。

散点图

适用场景:

  • 探索变量间的关系:当您需要探索两个变量之间是否存在某种关系时,散点图是一个理想的选择。例如,在医学研究中,可以用来分析血压与年龄之间的关系;
  • 识别模式和趋势:如果您的目标是识别数据中的特定模式或趋势,散点图可以帮助发现这些隐藏的规律。比如,销售数据与广告投入之间的关系可能显示出某种增长趋势;
  • 检测异常值:由于散点图直观地展示了所有数据点的位置,因此非常适用于检测数据集中的异常值或离群点。这些异常值可能是数据录入错误或其他特殊情况的表现;
  • 多维数据分析:通过使用不同的颜色、大小或形状来表示额外的变量,散点图可以扩展到三维甚至四维的数据可视化。例如,可以用颜色表示第三维度的数据,如不同地区的销售额分布。

不适用场景:

  • 分类数据:散点图不适合用于分类数据的展示,因为它主要针对的是连续变量。对于分类数据,柱状图或饼图可能更为合适;
  • 数据过于密集:当数据量非常大且点分布非常密集时,可能会出现“过覆盖”现象,即许多点重叠在一起,难以区分各个点的具体位置。在这种情况下,考虑使用透明度调整、抽样或者六边形分箱图等方法来改善可视效果;
  • 需要精确数值对比:尽管散点图擅长展示变量间的关系,但它不适合用于精确比较具体数值之间的差异。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 动态变化的数据:对于随时间动态变化的数据,散点图可能不是最佳选择。在这种情况下,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适。

1.气泡散点图

数据可视化:探索气泡图(bubble charts)的力量 - 知乎 (zhihu.com)
气泡图完全指南:数据可视化的新趋势 (boardmix.cn)
运动气泡图,反映3个指标的历年变化,如此生动! - 知乎 (zhihu.com)
气泡散点图(Bubble Scatter Plot) 是一种扩展版的散点图,它不仅展示了两个变量之间的关系(通过X轴和Y轴上的位置),还通过第三个维度——气泡的大小来表示第三个变量的信息。因此,气泡散点图能够同时展示三个变量的数据,并帮助观察者发现数据间的复杂关系。

主要特点:

  • 三维数据展示:除了 X 轴和 Y 轴代表的两个变量外,气泡的大小用来表示第三个变量。这使得气泡散点图能够在二维平面上展示三维信息;
  • 视觉编码:除了大小之外,颜色也可以作为额外的视觉编码手段来表示第四个变量,如类别或时间序列等,进一步增加图表的信息密度;
  • 直观性:气泡的大小变化可以非常直观地反映出第三个变量的变化趋势,便于快速识别模式、趋势以及异常值。

气泡图①
气泡图②

适用场景:

  • 多变量分析:当您需要同时展示三个或更多变量的关系时,气泡散点图是一个理想的选择。例如,在市场分析中,可以用气泡图展示销售额( X 轴)、利润( Y 轴)以及销售数量(气泡大小)之间的关系;
  • 数据集中的模式识别:通过观察气泡的位置及其大小,可以帮助识别出数据中的特定模式或趋势。例如,研究不同城市的空气质量指数( X 轴)、人口密度( Y 轴)及绿化覆盖率(气泡大小)的关系;
  • 强调重要性或规模:由于气泡的大小直接反映了某个变量的数值,因此非常适合用于强调某些元素的重要性或规模。例如,在财务报告中,可以通过气泡大小展示各业务部门的收入贡献;
  • 复杂数据集的简化表达:对于包含多个维度的数据集,气泡散点图提供了一种简洁而有效的方式来展示复杂的数据结构,使观众更容易理解和解读数据。

不适用场景:

  • 过多变量:虽然气泡散点图可以处理三个甚至四个变量,但如果试图展示更多的变量,可能会导致图表过于复杂,难以阅读。在这种情况下,可能需要考虑其他类型的可视化工具;
  • 数据过于密集:如果数据点非常多且分布密集,可能会出现气泡重叠的问题,影响对个别数据点的识别。此时,可以尝试使用透明度调整、抽样或者选择其他更适合高密度数据的图表类型;
  • 需要精确数值对比:尽管气泡散点图擅长展示变量间的关系和模式,但它不适合用于精确比较具体数值之间的差异。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 小样本量数据集:在处理样本量较小的数据集时,使用气泡散点图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

2.矩阵散点图

科研绘图(六)散点图矩阵-CSDN博客
散点图矩阵与大数据集的可视化分析-CSDN博客
矩阵散点图(Scatter Plot Matrix,也称为Pair Plot) 是一种用于展示多个变量之间两两关系的图表类型。它通过在一个网格中展示多个散点图来实现这一点,每个散点图表示一对变量之间的关系。矩阵散点图通常包括对角线上的额外信息,如直方图或密度图,以显示单个变量的分布情况。

主要特点:

  • 多变量分析:矩阵散点图允许同时查看多个变量之间的成对关系,这对于探索数据集中的模式、相关性和异常值非常有用;
  • 对角线信息:在矩阵的对角线上,通常会显示单个变量的分布情况,比如直方图或核密度估计图,这有助于理解各个变量的数据分布特性;
  • 直观比较:通过将所有可能的变量对组合在一起,用户可以方便地进行对比和探索,识别出潜在的相关性或模式。

矩阵散点图

适用场景:

  • 多变量关系探索:当您需要同时探索多个变量之间的两两关系时,矩阵散点图是一个理想的选择。例如,在金融分析中,可以用来查看股票价格、交易量、波动率等多个指标之间的关系;
  • 数据集中的模式识别:通过观察不同变量间的散点图,可以帮助识别出数据中的特定模式或趋势。例如,在生物信息学研究中,可以通过矩阵散点图探索基因表达水平与多种临床特征之间的关联;
  • 异常值检测:由于矩阵散点图能够展示所有变量之间的关系,因此非常适合用于检测数据集中的异常值或离群点。这些异常值可能是数据录入错误或其他特殊情况的表现;
  • 快速概览:对于初步数据分析阶段,矩阵散点图提供了一种快速且全面的方式来了解数据集的整体结构和变量间的关系,帮助制定进一步的分析策略。

不适用场景:

  • 变量数量过多:如果数据集中包含大量的变量(如超过10个),生成的矩阵散点图可能会变得非常庞大且难以解读。在这种情况下,考虑使用降维技术(如PCA)或选择感兴趣的变量子集进行分析;
  • 数据过于密集:当数据点非常多且分布密集时,散点图中的点可能会重叠,导致难以区分个别数据点的具体位置。此时,可以尝试使用透明度调整、抽样或者选择其他更适合高密度数据的图表类型;
  • 需要精确数值对比:尽管矩阵散点图擅长展示变量间的关系和模式,但它不适合用于精确比较具体数值之间的差异。如果您需要进行详细的数值对比,柱状图或条形图可能是更好的选择;
  • 小样本量数据集:在处理样本量较小的数据集时,使用矩阵散点图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

3.波士顿矩阵图

波士顿矩阵与象限分析法 - 知乎 (zhihu.com)
Excel 波士顿矩阵和四象限分析_波士顿矩阵的四个象限-CSDN博客
一定要懂的分类管理思维方式——波士顿矩阵 - 知乎 (zhihu.com)
第九章_6:矩阵分析法 - 知乎 (zhihu.com)
‌波士顿矩阵图是一种市场分析工具,由波士顿咨询集团(Boston Consulting Group)首创,也被称为BCG矩阵。它通过分析企业的产品组合或业务单元的相对市场份额和市场增长率,将企业产品或业务单元划分为四个象限,每个象限代表不同类型的产品或业务,从而为企业提供战略指导。这四个象限分别是:

  • 明星型业务(Stars):高市场增长率和高市场份额,通常处于快速增长的市场中,拥有较高的市场份额,需要大量资金投入以维持增长,能够带来较高收益;
  • 问题型业务(Question Marks)‌:高市场增长率但低市场份额,处于快速增长的市场中但市场份额较低,前景不确定,可能需要大量资金投入以增加市场份额;
  • 现金牛业务(Cash Cows)‌:低市场增长率和高市场份额,处于成熟市场中,市场增长率较低但拥有较高的市场份额,能够产生稳定且大量的现金流;
  • 瘦狗型业务(Dogs):低市场增长率和低市场份额,处于增长缓慢的市场中,市场份额也较低,通常不会产生大量现金流,可能会占用企业资源。

在使用波士顿矩阵图进行决策分析时,需要考虑到数据的真实性和准确性,以及指标之间的相关性,以确保分析结果的可靠性和有效性。此外,结合其他分析方法和工具,进行综合评估,可以进一步提高决策的准确性和有效性‌。
波士顿矩阵图

适用场景:
波士顿矩阵的应用场景非常广泛,包括但不限于:

  • 产品组合分析‌:通过波士顿矩阵分析产品组合,识别哪些产品或业务单元属于明星、问题、现金牛或瘦狗类型,从而制定相应的产品策略;
  • 资源分配‌:根据波士顿矩阵的结果,企业可以将资源集中在具有潜力的明星和问题业务上,同时保持对现金牛业务的维护,并考虑剥离或终止瘦狗业务;
  • 战略规划‌:波士顿矩阵有助于企业制定战略规划,例如继续投资和支持明星业务以巩固市场地位,保持对现金牛业务的支持以最大化收益,评估问题业务的潜力以决定是否加大投资或放弃,以及考虑剥离或终止瘦狗业务;
  • 用户分层‌:波士顿矩阵的思维模式也可以应用于用户分析,通过分析用户的活跃度和价值贡献,将用户分为不同的层次,从而制定相应的用户运营策略。

不适用场景:

  • 极大/极小值影响了平均值的情况‌:当数据集中存在极大或极小的值,这些极端值可能会扭曲数据的平均值,使得平均值不能真实反映数据的整体趋势。在这种情况下,使用波士顿矩阵图进行分析可能会导致误导性的结论;
  • 两个指标高度相关‌:如果波士顿矩阵图所依赖的两个指标(如市场份额和市场增长率)高度相关,那么这两个指标提供的信息可能会有重叠,导致分析结果不够准确。在这种情况下,使用波士顿矩阵图进行分析可能会忽略重要的变量,从而影响决策的有效性。

(七)词云图

词云图(Word Cloud) 是一种可视化工具,用于展示文本数据中单词的频率分布。在词云图中,单词的大小通常与其出现的频率成正比:越频繁出现的单词显示得越大,而不常出现的单词则较小。此外,词云图还可以通过不同的颜色、字体样式或布局来增强视觉效果和信息传达。

主要特点:

  • 直观性:词云图提供了一种快速且直观的方式来识别文本数据中的关键词和主题;
  • 简单易懂:无需专业背景知识即可理解词云图所表达的信息,非常适合用于非专业人士的报告或演示文稿中;
  • 美学设计:除了基本的文字大小变化外,词云图还可以通过颜色、方向等元素进行美化,使其更具吸引力。

词云图

适用场景:

  • 关键词提取:当您需要从大量文本数据中提取出最重要的关键词时,词云图是一个理想的选择。例如,在社交媒体分析中,可以通过词云图展示用户评论中最常提到的词汇;
  • 概览文本内容:对于长篇文档或大量的文本数据,词云图可以提供一个简明扼要的内容概览,帮助读者快速抓住文章的核心思想。例如,在新闻报道中使用词云图来概括报道的主要话题;
  • 品牌形象分析:企业可以通过分析客户反馈或在线评价生成词云图,了解公众对其品牌形象的认知。这有助于发现品牌的优势与不足之处,并据此调整营销策略;
  • 社交媒体趋势分析:利用词云图可以帮助分析社交媒体上的热门话题和趋势。通过对特定时间段内的帖子、推文等进行分析,可以迅速找出当前最受关注的话题。

不适用场景:

  • 精确数据分析:由于词云图主要用于展示关键词及其频率,它不适合用于精确的数据分析任务。如果您需要对具体数值进行详细比较或分析,柱状图、折线图或其他类型的数据图表可能更为合适;
  • 复杂语义关系:虽然词云图能很好地展示单词的频率,但它无法清晰地表示单词之间的复杂语义关系或上下文信息。在这种情况下,网络图、树状图或其他类型的结构化图表可能更适合;
  • 小样本量数据集:当处理少量文本数据时,生成的词云图可能无法准确反映真实的情况,并可能导致误导性的结论。在这种情况下,直接查看原始文本或采用其他适合小样本量的方法会更合适;
  • 文本质量差:如果输入的文本数据质量不高,如包含大量噪音(无关紧要的词汇)、拼写错误或不规范用词,生成的词云图可能会失去其应有的意义,难以有效传达有用信息。

(八)子弹图

高级图表应用与技巧02 | 标靶图 - 知乎 (zhihu.com)
数据可视化-比较类-子弹图 - 知乎 (zhihu.com)
子弹图,又称标靶图,顾名思义就是样子很像子弹弹射出后带出的轨道,所以称之为子弹图。子弹图是一种紧凑、高效的图表类型,最初由数据可视化专家Stephen Few提出。它通常用于展示一个主要指标相对于目标值的表现,并同时提供额外的定性范围信息(如好、中、差等)。子弹图的设计目的是为了替代仪表盘上的仪表盘式图表(gauge charts),因为它提供了相同的信息,但占用的空间更少且更容易阅读。

主要特点:

  • 紧凑高效:子弹图通过紧凑的设计来展示关键绩效指标(KPIs)及其与目标值的关系,使得在有限的空间内能够传达大量信息;
  • 定量与定性结合:除了显示实际值和目标值外,子弹图还可以包含背景色块或区间,用以表示不同层次的目标达成情况(例如,优秀、良好、需改进等);
  • 简单直观:子弹图设计简洁,易于理解和解读,适合用于快速查看业绩表现。

子弹图

结构组成:

  • 主度量(Primary Measure):这是您想要监控的核心数值,通常表现为一条粗线或填充区域;
  • 比较度量(Comparative Measure):通常是目标值或基准值,表现为一条垂直的细线,用来对比主度量是否达到预期目标;
  • 定性范围(Qualitative Ranges):这些是背景色块或区间,用来区分不同的绩效等级(如低、中、高),帮助用户快速判断当前表现处于哪个水平。

适用场景:

  • 绩效评估:当需要评估某个具体指标是否达到了预设目标时,子弹图是一个理想的选择。例如,在销售报告中,可以用来展示实际销售额相对于年度目标的完成情况;
  • 进度跟踪:对于项目管理中的进度跟踪,子弹图可以帮助团队成员快速了解项目的当前进展以及距离目标还有多远;
  • 资源分配分析:在资源管理和预算分配过程中,子弹图可用于显示各项支出的实际花费与预算限额之间的关系;
  • 关键业务指标(KPIs)监控:企业可以使用子弹图来持续监控各种关键业务指标的表现,如客户满意度、产品质量、交付时间等。

不适用场景:

  • 多变量分析:如果需要同时展示多个变量之间的关系,子弹图可能不是最佳选择。它的设计初衷是为了聚焦于单一的关键指标,因此不适合复杂的多维数据分析任务;
  • 需要详细数据展示:尽管子弹图擅长于概览性的绩效评估,但它并不适合用于展示详细的数值细节或进行精确的数据对比。在这种情况下,柱状图、折线图或其他类型的图表可能更为合适;
  • 动态变化的数据:对于随时间动态变化的数据,子弹图可能不是最佳选择。虽然可以通过多个子弹图来表示不同时间段的表现,但对于这种需求,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适;
  • 小样本量数据集:在处理样本量较小的数据集时,使用子弹图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

1.层叠子弹图

层叠子弹图(Stacked Bullet Chart) 是标准子弹图的一种变体,它允许在同一图表中展示多个相关指标的叠加视图。这种类型的图表不仅展示了单个关键绩效指标(KPI)的表现及其与目标值的关系,还可以同时展示该KPI下的细分组成部分或不同维度的数据贡献。通过这种方式,层叠子弹图提供了比传统子弹图更丰富的信息层次和更深入的洞察力。

主要特点:

  • 多维度展示:层叠子弹图可以展示一个主要KPI的不同组成部分或分类,使得用户能够了解各个部分对整体表现的具体贡献;
  • 紧凑高效:尽管增加了信息量,层叠子弹图仍然保持了子弹图紧凑、节省空间的优点,适合用于仪表板或报告中需要展示大量数据的情况;
  • 直观比较:通过将多个相关的度量值堆叠在一起,用户可以直观地进行对比,识别出哪些部分对总体结果有更大的影响。

层叠子弹图

结构组成:

  • 主度量(Primary Measure):仍然是您想要监控的核心数值,但在这里它可以被细分为几个子部分;
  • 分段度量(Segmented Measures):这些是构成主度量的不同组成部分,通常以不同的颜色表示,并且堆叠在一起形成一个整体;
  • 比较度量(Comparative Measure):目标值或基准值,用作衡量主度量及其各分段是否达到预期的标准;
  • 定性范围(Qualitative Ranges):背景色块或区间,用来区分不同的绩效等级(如低、中、高),帮助用户快速判断当前表现处于哪个水平。

适用场景:

  • 复合KPI分析:当需要评估一个复合型KPI(由多个子指标组成)的整体表现以及各子指标的贡献时,层叠子弹图是一个理想的选择。例如,在销售分析中,可以展示总销售额以及来自不同销售渠道(线上、线下等)的具体贡献;
  • 部门绩效评估:对于企业内部的不同部门或团队,层叠子弹图可用于展示各部门在实现公司整体目标中的具体贡献。这有助于管理层更好地理解各部门的表现及其相互作用;
  • 资源分配优化:在资源管理过程中,层叠子弹图可以帮助展示各项资源的实际使用情况及各自对最终成果的影响。例如,展示项目预算的实际花费分布于人力、材料、设备等方面;
  • 客户满意度调查:利用层叠子弹图来展示客户满意度评分的详细构成,如产品性能、服务质量、价格等多个方面的反馈,从而帮助企业识别改进的重点领域。

不适用场景:

  • 简单单一指标:如果仅需展示单一指标而不需要进一步分解其组成部分,使用标准子弹图可能更为简洁明了。层叠子弹图在这种情况下可能会显得过于复杂;
  • 数据过于复杂:当数据集包含过多细分项或层级结构过于复杂时,层叠子弹图可能会变得难以阅读和理解。在这种情况下,考虑使用其他更适合处理复杂数据关系的可视化工具,如树形图或矩阵图;
  • 动态变化的数据:对于随时间动态变化的数据,层叠子弹图可能不是最佳选择。虽然可以通过多个层叠子弹图来表示不同时间段的表现,但对于这种需求,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适;
  • 小样本量数据集:在处理样本量较小的数据集时,使用层叠子弹图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

2.反向子弹图

反向子弹图(Reversed Bullet Chart) 是标准子弹图的一种变体,它通过改变图表的方向来适应特定的分析需求或视觉偏好。与传统的子弹图相比,反向子弹图的主要度量和目标值的位置被颠倒,通常是从右向左展示数据,而不是从左到右。这种调整使得反向子弹图特别适合某些特定的应用场景,如需要对比从高到低排序的数据或特定文化背景下更倾向于从右向左阅读的习惯。

主要特点:

  • 方向调整:反向子弹图改变了传统子弹图的方向,通常是从右向左展示数据。这不仅适应了不同的视觉习惯,也可以用于强调数据的不同方面;
  • 保持简洁性:尽管方向发生了变化,反向子弹图依然保持了子弹图紧凑、高效的特点,适用于仪表板或报告中需要展示大量数据的情况;
  • 灵活性增强:通过调整方向,反向子弹图提供了更多的灵活性,可以根据具体的应用场景进行定制,以更好地传达信息。

反向子弹图

结构组成:

  • 主度量(Primary Measure):这是您想要监控的核心数值,但在反向子弹图中,它通常从右侧开始向左延伸;
  • 比较度量(Comparative Measure):通常是目标值或基准值,在反向子弹图中,这条线也会相应地调整位置,通常位于左侧;
  • 定性范围(Qualitative Ranges):背景色块或区间仍然用来区分不同的绩效等级(如低、中、高),但它们的方向也会随之调整。

适用场景:

  • 从高到低排序的数据展示:当您的数据更适合从高到低排序时,反向子弹图是一个理想的选择。例如,在显示产品的退货率时,您可以从最差的表现开始向最好的表现过渡;
  • 特定文化的阅读习惯:在一些文化和语言环境中,人们习惯于从右向左阅读。在这种情况下,使用反向子弹图可以更好地符合用户的阅读习惯,提高信息的理解效率;
  • 对比分析:反向子弹图非常适合用于对比分析,特别是当您希望突出显示两个极端之间的差异时。例如,在环境监测中,可以用来展示污染水平从最高点到最低点的变化情况;
  • 资源消耗评估:在资源管理中,反向子弹图可用于展示资源的消耗情况,从完全消耗的状态逐步减少到理想的节约状态,帮助识别改进的机会。

不适用场景:

  • 普遍接受的标准方向:如果您的受众习惯于传统的从左到右的阅读顺序,那么反向子弹图可能会导致混淆。在这种情况下,标准的子弹图可能更为合适;
  • 数据过于复杂:当数据集包含过多细分项或层级结构过于复杂时,即使是反向子弹图也可能变得难以阅读和理解。在这种情况下,考虑使用其他更适合处理复杂数据关系的可视化工具,如树形图或矩阵图;
  • 动态变化的数据:对于随时间动态变化的数据,反向子弹图可能不是最佳选择。虽然可以通过多个反向子弹图来表示不同时间段的表现,但对于这种需求,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适;
  • 小样本量数据集:在处理样本量较小的数据集时,使用反向子弹图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,考虑直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

(九)漏斗图

漏斗图(Funnel Chart) 是一种专门用于表示流程中各个阶段转化率的图表类型。它通常用来展示一个流程从开始到结束的过程中,数据量如何逐步减少的情况。漏斗图因其形状类似于实际的漏斗而得名,广泛应用于销售、市场营销以及客户关系管理等领域,以可视化的方式展示潜在客户的转化路径或业务流程中的损耗情况。

主要特点:

  • 流程可视化:漏斗图能够清晰地展示一个流程的不同阶段及其对应的数量变化,使得用户可以直观地看到每个阶段的数据流失情况;
  • 阶段划分明确:每一个阶段在漏斗图中表现为一个不同的段落,宽度代表该阶段的数据量大小,从而帮助识别哪些阶段存在较高的流失率;
  • 转化率计算:通过比较相邻阶段的宽度差异,可以很容易地计算出各阶段之间的转化率,这对于评估业务流程的有效性非常有用。

结构组成:

  • 顶部(入口):代表整个流程的起点,通常是最大的部分,包含了所有初始数据点(例如,潜在客户总数);
  • 中间段落:每个段落代表流程中的一个特定阶段,随着流程的推进,这些段落逐渐变窄,反映了在这个过程中数据量的减少;
  • 底部(出口):代表流程的终点,包含的是最终成功完成整个流程的数据点(例如,实际成交的客户数)。

漏斗图

适用场景:

  • 销售管道分析:当需要跟踪和分析销售过程中的各个阶段时,漏斗图是一个理想的选择。它可以清楚地显示从潜在客户到最终购买者的转换路径,并帮助识别出哪个阶段有最高的流失率;
  • 市场营销活动效果评估:对于在线广告、电子邮件营销等数字营销活动,漏斗图可用于展示用户从点击广告到注册、再到最终购买的行为路径,帮助优化营销策略;
  • 客户生命周期管理:在客户关系管理(CRM)系统中,漏斗图可以帮助企业了解客户在整个生命周期内的行为模式,如从初次接触到成为忠实客户的过程;
  • 用户体验设计:对于网站或应用程序的设计者来说,漏斗图可以用来分析用户的使用路径,找出用户在哪个步骤最容易退出,从而改进用户体验。

不适用场景:

  • 非线性流程:如果业务流程不是线性的,而是包含多个分支或循环,那么漏斗图可能无法准确反映实际情况。在这种情况下,其他类型的图表,如流程图或Sankey图,可能更为合适;
  • 数据过于复杂:当涉及到大量变量或复杂的数据集时,漏斗图可能会变得难以解释。此时,考虑使用更复杂的可视化工具,如热力图或多维散点图,可能更有助于揭示数据背后的故事;
  • 精确数值对比:尽管漏斗图擅长于展示流程中的转化率,但它并不适合用于精确数值的对比。如果您需要进行详细的数值对比,柱状图、折线图或其他类型的图表可能更为合适;
  • 小样本量数据集:在处理样本量较小的数据集时,使用漏斗图可能无法准确反映真实趋势,并可能导致误导性的结论。在这种情况下,直接展示原始数据点或采用更适合小样本量的图表类型会更合适。

(十)箱线图

箱线图(Box Plot),也称为盒须图(Box-and-Whisker Plot),是由美国数学家John Tukey在1970年代提出的一种统计图表。它通过五数概括法(最小值、第一四分位数 Q 1 Q_1 Q1、中位数、第三四分位数 Q 3 Q_3 Q3 和最大值)来展示一组数据的分布情况,特别适合用于识别数据中的异常值、偏态以及数据的集中趋势和离散程度。

主要特点:

  • 五数概括:箱线图主要依赖于五个关键数值来描述数据集:
    • 最小值(Minimum):除去异常值后的最小观测值;
    • 第一四分位数(Q1):数据集中 25% 的数据小于等于此值;
    • 中位数(Median):数据集的中间值,即 50% 的数据小于等于此值;
    • 第三四分位数(Q3):数据集中 75% 的数据小于等于此值;
    • 最大值(Maximum):除去异常值后的最大观测值。
  • 箱体与须:箱体部分显示了从 Q 1 Q_1 Q1 Q 3 Q_3 Q3 的范围,也就是中间 50% 的数据;“须”则延伸至非异常值的最小值和最大值。超出须的部分通常被认为是异常值,并以单独的点或星号标记;
  • 识别异常值:箱线图能够有效地识别出可能的异常值,这些异常值通常位于上下边界之外:
    • 上限 Q 3 + 1.5 ∗ I Q R Q_3+1.5*IQR Q3+1.5IQR
    • 下限 Q 1 − 1.5 ∗ I Q R Q_1-1.5*IQR Q11.5IQR
    • 四分位距 I Q R = Q 3 − Q 1 IQR=Q_3-Q_1 IQR=Q3Q1

结构组成:

  • 箱体:由Q1到Q3构成,代表了数据集的中间50%;
  • 中位线:箱体内的一条横线,表示数据集的中位数;
  • :从箱体两端延伸出去的线条,分别指向非异常值的最大值和最小值;
  • 异常值:超出须的范围的数据点,通常用特殊符号(如圆圈或星号)标注。

箱线图介绍

箱形图

适用场景:

  • 数据分布分析:当需要了解一组数据的分布特性时,箱线图是一个理想的选择。它不仅能显示数据的中心位置和分散程度,还能揭示数据是否对称及其是否存在异常值;
  • 比较不同组的数据:箱线图非常适合用来比较两组或多组数据的分布情况。例如,在医学研究中,可以用来对比不同治疗方案的效果差异;
  • 异常值检测:由于箱线图能直观地显示出哪些数据点可能是异常值,因此在质量控制、金融风险管理等领域非常有用;
  • 数据探索性分析:在数据分析的初步阶段,箱线图可以帮助快速识别数据的基本特征,为进一步分析提供方向。

不适用场景:

  • 多模态数据:如果数据具有多个峰值(即多模态),那么箱线图可能无法充分展示这种复杂性。在这种情况下,考虑使用直方图或其他更适合展示数据分布细节的图表类型;
  • 小样本量数据集:对于样本量较小的数据集,箱线图可能会给出误导性的结果,因为它依赖于少量的数据点来计算四分位数等统计量。在这种情况下,直接查看原始数据或采用其他更合适的图表类型会更好;
  • 需要详细数值对比:尽管箱线图擅长于展示数据的分布和异常值,但它不适合用于精确数值之间的对比。如果您需要进行详细的数值对比,柱状图、折线图或其他类型的图表可能更为合适;
  • 动态变化的数据:对于随时间动态变化的数据,箱线图可能不是最佳选择。虽然可以通过多个箱线图来表示不同时间段的表现,但对于这种需求,时间序列图或其他更适合展示时间维度变化的图表类型可能更加合适。

注意事项:
在标准的箱线图(Box Plot)中,理论上上下限(即“须”的端点)是基于第一四分位数(Q1)和第三四分位数(Q3)计算得出的,具体来说,通常是通过以下公式确定:

  • 下限 = Q 1 − 1.5 ∗ I Q R 下限 = Q_1 - 1.5 * IQR 下限=Q11.5IQR
  • 上限 = Q 3 + 1.5 ∗ I Q R 上限 = Q_3 + 1.5 * IQR 上限=Q3+1.5IQR

这种计算方法旨在识别出可能的异常值,任何低于下限或高于上限的数据点都被视为异常值。然而,在实际绘制箱线图时,您可能会发现上限到 Q 3 Q_3 Q3 的距离并不总是等于 Q 1 Q_1 Q1 到下限的距离,这主要是因为:

  • 数据的实际最小值和最大值限制了“须”的长度:虽然理论上的下限和上限按照上述公式计算,但在实际应用中,“须”的端点不能超过实际数据中的最小值和最大值。如果数据集中没有数据点达到理论上的下限或上限,那么“须”将终止于最接近的非异常值数据点上。这意味着:
    • 如果数据集中的最小值大于 Q 1 − 1.5 ∗ I Q R Q_1 - 1.5 * IQR Q11.5IQR,则下限将是该最小值;
    • 如果数据集中的最大值小于 Q 3 + 1.5 ∗ I Q R Q_3 + 1.5 * IQR Q3+1.5IQR,则上限将是该最大值。
  • 异常值的存在:箱线图定义了超出 Q 1 − 1.5 ∗ I Q R Q_1 - 1.5 * IQR Q11.5IQR Q 3 + 1.5 ∗ I Q R Q_3 + 1.5 * IQR Q3+1.5IQR 范围的数据点为异常值,并以单独的符号标记这些点(如圆圈或星号)。因此,即使存在理论上更大的上限或更低的下限,实际的“须”不会延伸到这些位置,而是截止于最后一个非异常值的数据点。

综上所述,箱线图中上下限与 Q 1 Q_1 Q1 Q 3 Q_3 Q3 之间的距离不等,通常是因为实际数据分布的影响以及对异常值的处理方式导致的。这种特性使得箱线图能够有效地展示数据的整体分布情况,同时突出显示潜在的异常值。如果您的数据集具有极端值或者分布不均匀,这样的现象会更加明显。

;