本期将带领大家一起对在数据可视化的过程中常用的一些图表进行下总结:
条形图
【适用场景】
适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。
【优势】
条形图利用条形的高度,反映数据的差异,肉眼对高度差异很敏感。
【劣势】
条形图的局限在于只适用中小规模的数据集。维数太多条形会挤在一起,使其效果变差。
【适用数据】
数据集不大, 二维数据。
饼状图
【适用场景】
显示各项的大小与各项总和的比例。适用简单的占比比例图,在不要求数据精细的情况适用。一般适用于不超过5个维度的情况。
【优势】
明确显示数据的比例情况,尤其合适渠道来源等场景。
【劣势】
肉眼对面积大小不敏感。
【适用数据】
具有整体意义的各项相同数据。
折线图
【适用场景】
折线图适合二维的大数据集,还适合多个二维数据集的比较。
【优势】
容易反应出数据变化的趋势。
【劣势】
数据集太小时显示不直观。
【适用数据】
时间序列类数据、关联类数据。
散点图
【适用场景】
显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。散点图适用于三维数据集,但其中只有两维需要比较。
【优势】
对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。
【劣势】
在点状图中显示多个序列看上去非常混乱。
【适用数据】
离散值数据。
箱型图
【适用场景】
适用场合是显示一组数据分散情况,因形状如箱子而得名。
【优势】
不受异常值的影响,可以以一种相对稳定的方式描述数据的离散分布情况,同时也有利于数据的清洗。
雷达图
【适用场景】
雷达图适用于多维数据(四维以上),且每个维度必须可以排序
【优势】
主要用来了解一个系统内部各项数据指标的变动情形及其好坏趋向。
【劣势】
数据点最多6个,否则无法辨别,因此适用场合有限。
【适用数据】
数值型数据,不同数据的维度要保持一致。
桑基图
【适用场景】
它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,将数据在实体之间流动的情况可视化,如,表示在线学习社区不同时间阶段不同用户的活跃程度(定义为低频、中频和高频用户)变化流程以及最终的累计情况,图中流线的粗细象征着用户数的多少,十分直观。
—————————END—————————
题外话
感兴趣的小伙伴,赠送全套Python学习资料,包含面试题、简历资料等具体看下方。
CSDN大礼包:全网最全《Python学习资料》免费赠送!(安全链接,放心点击)
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
工具都帮大家整理好了,安装就可直接上手!
三、最新Python学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试宝典
简历模板
CSDN大礼包:全网最全《Python学习资料》免费赠送!(安全链接,放心点击)
如有侵权,请联系删除。