在工作中会发现很多人在做图表的时候批八字所需各种图表,最容易出现错误的地方不是在对数据的处理上批八字所需各种图表,而是在对图表的选择上。图表种类如此之多,什么场景下用什么图表展示最合适,确实是一个难题,一旦用了不合适的图表来表达数据,反而会“事倍功半”。
废话不多说,想解决这个难题,就来跟我看下在日常工作中,会常用到的6种类型的可视化图表,针对这些图表,我都列举了相应的适用场景和例举图表,内容很干,记得收藏备用。
1、占比类型在有关比例的可视化中,我们主要对每一部分的大小占总数的百分比感兴趣,占比可以显示部分和整体的关系,比如:
公司某款产品的销售额占总销售额的超过30%5月份,A产品的销售量占公司总销售量的首位2001年客户市场份额少于整个行业的10%你的主题中只要包括如下词汇如:占比、总数百分比、占百分比多少等字样时,可以肯定你是在制作一个部分和整体的关系图表。
公司人员学历构成
市场份额占比
入选影片占比
2、比较与排序类型人们习惯于对比和排序,我们需要比较类别间的大小、高低,它们是相同的,还是比其它类别多或少?
2020年公司内所有部门的绩效排名这个季度草莓奶茶和蜜桃奶茶的销量高低2021年一季度中国的 GDP 和美国 GDP 的增速对比我们可以从排名、大于、小于、高于、低于、相同之类的词汇中找到类别比较的线索。
华东、华北地区销量对比
TOP10 车型
3、时间趋势类型时间序列数据无处不在,我们通过时间序列数据来观察这些事物是如何变化的。例如:
近6个月的股价变动过去5年我司的盈利状况过去10年的薪资水平均处于一个小幅增长的态势21世纪的前20年,中国的贫困人口占总人口的比例持续降低利率在过去的7个季度中上下波动时间序列对比关系的触发词有:变化、增长、下降、减少、波动等,常见模式如下:
趋势性:数据随时间变化的呈整体上升或下降的趋势季节性:数据在每年的特定季度、月份、周、日的数据波动周期性:数据存在不固定频率的上升和下降时,表示该序列有周期性,通常与商业活动有关2006 年到 2012 年的居民消费支出趋势
2020年上半年品类销售走势
4、频率分布类型这种对比关系表示有多少个项目或类别符合一个数字发展的范围,比如:
1500 多个景点的中差评率分布我司有多少员工的月薪超过 5 万元,有多少员工的月薪处于 3-5 万元之间,有多少员工的月薪在 1-3 万元区间等。有多少员工的年龄小于 25 岁,25-30 员工人数有多少、超过 30 岁的员工人数有多少等。我司 10 月份的客户订单金额主要集中在 20 万-30 万元之间;多数客户订单的交付时长在 4-6 周之间;这种对比关系的关键词包括:x 到 y 的范围,密度,频率,分布等。
男女年龄分布情况/人口金字塔
学生各科考试成绩分布情况
5、位置分布位置分布是根据地理位置数据,通过地图展示不同分布特征,比如:
各个国家的产品出口目的地全国排名前300的学校地区分布全国各省份的销售额情况国家/地区的各个区域的库存江苏省各城市的房价情况流向地图多应用于区际贸易、交通流向、人口迁移、购物消费行为、通讯信息流动、航空线路等场景
湖北省除武汉外新冠肺炎确诊病例
各航空公司的飞行计划
6、相关性人们总是在找事物之间的相关性,统计学就是要寻找数据之间的关系。
相关性对比关系展示两个或多个变量之间的关系,比如:
人的身高和体重之间的关系产品价格会影响销售额吗天气和冰淇淋的销量有关系吗当你的主题包括与什么相关,随什么增长,随什么减退,根据什么变化,或者不随什么增长等,那么就可以断定是一个相关性对比关系。
身高与体重的关系
流量来源分析
我是“数据分析不是个事儿”,常年分享数据分析干货,不定期分享好用的职场技能工具。