本文介绍了数据产品经理需要懂的常用图表设计,并针对19种图表的定义、适用场景、优缺点,进行了分析说明。
概述
数据产品经理在日常产品设计时经常需要设计一些图表来对数据进行更好的展现,也能方便用户更好的从数据中获得有价值的信息。图表是将数据进行可视化展现的图,用来方便理解大量数据以及数据间的关系。数据产品经理在进行图表设计时首先进行需求的分析,熟悉数据并且明确数据要展现出来的信息,然后选用合适的图表来进行数据的展现。
常用图表
常用的图表有很多,在进行数据产品设计时需要根据数据选用合适的图表展现来把数据的信息传达给用户,因此,我们需要熟悉每种图表的定义、适用场景、优缺点,这样才能快速选择合适的图表。
1. 柱状图
定义:柱状图是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。
优点:直观表达各组数据差异性,强调个体与个体之间的比较。
2. 折线图
定义:用于显示数据在一个连续的时间间隔或者时间跨度上的变化,它的特点是反映事物随时间或有序类别而变化的趋势。折线图分为直线折线图和曲线折线图。折线图可以清晰的反映数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征。
适用场景:反映变化趋势
优点:直观反映数据变化趋势
缺点:数据集太小时显示不直观
3. 条形图
定义:条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图能够使人们一眼看出各个数据的大小,易于比较数据之间的差别。
优点:直观展现数据的差别
4. 饼图
定义:用于表示不同分类的占比情况,通过弧度大小来对比各种分类。饼图通过将一个圆饼按照分类的占比划分成多个区块,整个圆饼代表数据的总量,每个圆弧所在的块表示该分类占总体的比例大小,所有圆弧所在的块组成的圆饼等于 100%。可以很好地帮助用户快速了解数据的占比分配。
适用场景:对一个对象和整体之间的关系进行比较
优点:直观反映比例关系,了解数据的分布情况
缺点:分类过多,则扇形越小,无法展现图表;无法直观进行各个数据的比较,难以直接对数据大小进行排序。
5. 散点图
定义:数据点在直角坐标系平面上的分布图,表示因变量随自变量而变化的大致趋势。
优点:有一定的数据量时展现两个变量之间是否存在数量关联趋势
缺点:数据量较少时无法展现关联趋势
6. 气泡图
定义:气泡图是显示变量之间相关性的一种图表,使用直角坐标系的两个轴变量、气泡大小和颜色变量来分析数据的规律。
适用场景:有一定的数据量是展现三个变量之前的相关性,数据具有3个序列、特征及相关值。
缺点:数据量较小时无法反映数据的规律,数据量较大时不便于理解。
7. 面积图
定义:是随时间变化而改变范围的图表,又称区域图。
优点:更直观的表现趋势的大小
缺点:数据尽量不要重叠,否则可读性较差。
8. 雷达图
定义:雷达图又称为蜘蛛网图、网络图,蜘蛛图,星图,是以在同一点开始的轴上显示的三个或更多个变量的二维图表的形式来显示多元数据的方法,其中轴的相对位置和角度通常是无信息意义的。
适用场景:适用于显示三个或更多的维度的变量,常用于排名、评估、评论等数据的展示。
优点:用于综合分析多个指标,具有完整,清晰和直观的优点。
缺点:多维度但是不能太多,一般四到八个;比较的记录条数不宜太多。
9. 箱型图
定义:又称盒须图、盒式图或箱线图,是一种用作显示一组数据分布情况的统计图,使用了5个数字对分布进行概括,即一组数据的最大值、最小值、中位数、下四分位数及上四分位数。
优点:能够准确稳定地描绘出数据的离散分布情况,排除异常值的干扰,有利于数据的清洗
缺点:不能提供关于数据分布偏态和尾重程度的精确度量;在数据量较大时反映的形状信息更加模糊;用中位数代表总体平均水平有一定的局限性。
10. K线图
定义:原名蜡烛图,又称阴阳图、棒线、红黑线或蜡烛线,是反映价格走势的一种图线,其特色在于一个线段内记录了多项讯息,相当易读易懂且实用有效。K线可分“阳线”、“阴线”和“中立线”三种,阳线代表收盘价大于开盘价,阴线代表开盘价大于收盘价,中立线则代表开盘价等于收盘价。将某段时间内的各单位时间下的K线综合起来便可绘出“K线图”,其横轴为时间,纵轴为价格。
优点:能够全面透彻地观察到市场上价格的真正变化,了解市场趋势和波动。
缺点:绘制方法十分繁复,阴线与阳线的变化繁多,有一定的理解门槛。
11. 热力图
定义:以特殊高亮的形式显示数据集中的区域和数据所在的地理区域的图示,其背景往往是图片或者地图。
适用场景:适合用于直接对数据量较大的、相对原始的数据进行分析。
优点:可以直观清楚地看到每一个区域的数据分布情况。
12. 仪表盘
定义:一个钟表或者可读盘,有刻度和指针,其中刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。
适用场景:数据总览、管理报表或报告,直观的表现出某个指标的进度或实际情况。
优点:用于进度或占比的展现
缺点:每个仪表盘只能一个维度,同时展现的指标也不宜过多,展示信息有限,不适用于表现数据的趋势、分布特征。
13. 漏斗图
定义:由多个梯形从上而下叠加而成。从上到下的项有逻辑上的顺序关系,梯形面积表示某个业务量与上一个环节之间的差异。
适用场景:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观的发现和说明问题所在的环节,进而做出决策。
优点:清晰分析各个环节数据表现情况
缺点:无法比较数值,需要较大的数据量。
14. 地图
定义:使用地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分布通过颜色或者气泡映射在地图上。
适用场景:适合带有地理位置信息的数据集展现,展现的通常是以某个地区为单位的汇总的连续信息。
优点:和地图相结合,对数据的地理分步显示直观通过颜色深浅、气泡大小等容易判断度量的大小。
缺点:必须有地理信息,并且数据为汇总数据,气泡容易叠加;数据分布和地理区域大小的不对称。
15. 树图
定义:通过树形结构来展现数据的组织关系,以父子层次结构来组织对象。
适用场景:适用于与组织结构有关的分析,即有明确的层次关系的数据。
优点:直观的展现数据的层次关系,能够看到各层级指标间的关系,可以进行简单的上卷、下钻等操作。
缺点:数据层级不宜过多,每层的成员不宜过多,无法展现各部分占比关系。
16. 矩形树图
定义:矩形树图采用矩形表示层次结构里的节点,父子节点之间的层次关系用矩形之间的相互嵌套隐喻来表达,矩形的面积大小通常对应节点的属性。
适用场景:适合展现具有层级关系的数据,能够直观体现同级之间的比较。
优点:矩形树图比树形结构图能更有效的利用空间,并且拥有展示占比的功能。
缺点:当分类占比太小的时候文本会变得很难排布;矩形树图的树形数据结构表达的不够直观、明确。
17. 桑基图
定义:桑基图用于描述一组值到另一组值的流向,是一种特定类型的流图。它的起始流量和结束流量相同,所有主支宽度的总和与所有分出去的分支宽度总和相等,保持能量的平衡;在内部,不同的线条代表了不同的流量分流情况,它的宽度成比例地显示此分支占有的流量;节点不同的宽度代表了特定状态下的流量大小。
适用场景:通常应用于能源、材料成分、金融等数据的可视化分析。
优点:能较好的描述多级关系,按照层级给节点分类,适合的数据条数超过10条
缺点:桑基图需要保持能量守恒,不能在中间过程创造出流量,流失的流量应流向表示损耗的节点,所以每条边的宽度是保持不变的。
18. 微型图
定义:又称迷你图,主要是配合数值、比例进行图形化展现其大小或者占比。
优点:突出每一条数据的数值、比例,强调单条数据的大小和趋势。
缺点:数据项较多时,有效信息的获取较为耗时;图形中展现的信息较少,不能给出更详细的信息。
19. 词云
定义:又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。
适用场景:对比大量文本;使用图片做边界限制
优点:适合大量数据,展示文字更为直观
参考资料
https://antv.alipay.com/zh-cn/g2/3.x/demo/index.html
https://www.echartsjs.com/examples/zh/index.html
https://www.highcharts.com.cn/demo/highcharts