直方图与幂分布
当数据摆在你面前的时候,你应该如何从数据当中发现特征?一个最简单的办法——直方图。
直方图是展示数据的分布,是连续的,而柱状图是比较数据的大小,是离散的。
直方图是针对定量数据分布的定性分析,柱状图是对分类数据的定量数据分析,这两兄弟长得很像,用途也是互为补充。
幂律分布与帕累托法则
幂率分布也叫做指数分布,你会发现在这种分布里,X 轴的开始的地方数值很高(或很低),然后以指数级的下降(或上升)到 X 轴的末尾段,按照统计学定义叫做:“分布密度函数是幂函数的分布”。
这样的规律其实无处不在,拿我们日常使用的词汇来说,你自己最常用的词汇往往就是那些 500~1000 个词,其余的词汇少量或者更少量在书面时候使用,如果你把你自己的用词数做一个直方图,你会发现语言的词汇使用率也是呈幂律分布的。
那么这种现象是怎么产生的呢?
病毒、树种和语言其实都有一个共性——传播性。比如在亚马逊雨林里,两株植物长在了一块,那么每天这两株植物就要为阳光和土壤中的养分去竞争。如果其中一株能比另外一株植物每天稍微长快一点,那么它就能长得更高,从而获得更多的阳光、吸收更多的养分。如果每天都有这些额外的能量,这株植物就更加有能力把种子给传播出去,然后复制这种模式。一直持续下去,这种植物就会积累出得天独厚的优势。
思:强者更强,弱者更弱,这也是丛林法则。
说到幂律分布,那就不得不提一下帕雷托法则了。你或许对帕累托法则有些陌生,但我要是说二八法则,你肯定听过。
二八法则简单来说,就是 20% 的人占了 80% 的资源,剩下 80% 的人分最后 20% 的资源。这个法则诞生于帕累托的花园。有一天帕累托偶然发现,自己园子里绝大部分的豌豆是由园子里极少部分豌豆荚产生。作为一名擅长数学的经济学家,帕累托意识到这里面大有玄机。于是他马上把这种现象应用到了生活的其他领域,他惊奇地发现,意大利人 80% 的土地仅掌握在 20% 的手的人的手中,就和园子当中的豌豆荚类似,于是发表了著名的“帕雷托法则”(也被人称之为“二八法则”)。这个法则的背后的规律就是幂律分布。
幂律分布与帕累托法则其实都强调了重要的少数和琐碎的多数,从某种意义上来讲,世界从来都不是平衡的。
所以在日常生活里,不要把所有事都放在同一个优先级上,而是学会用帕累托法则去看待问题,找出最重要的 20% 的问题,并最优先解决。同时,你也要留个心眼:为什么这 20% 的问题对你来说最为重要?
对应到工作中,你可以多想想以下几个问题。
- 在你一天的工作分配当中,由于 80% 的工作都是日常反馈,你是否安排了自己最清醒的时间去处理最重要的 20% 工作?
- 你所在的公司,是不是由 20% 的客户来为公司提供了 80% 的利润,如果是,应该如何留住这些客户?
- 在团队里,杰出贡献是 20% 的人做的,80% 的人是配合,那么针对这 20% 的人,你应该如何留住他们?
- 能否通过弥补 20% 的质量缺口去获得 80% 的收益(或者避免 80% 的客户投诉)?
- 在最有效的 20% 的时间内,如何引导团队做出 80% 的相关分析?
最后再来说说我们个人的发展。为什么有的人一开始和普通人差不多,但是他们后来渐渐地把同龄人甩在了身后?有的人可能会觉得是因为这些人运气好,运气也是实力的一部分,但毕竟“幸运只光顾有准备的人”。你比其他人更努力,每天多积累 1% 哪怕是 0.1% 的优势,这样把优势不断积累下去,你就会占据越来越多的资源,成为这个领域里面的专家。
幂律分布这个统计学规律告诉我们,我们身处的世界是赢者通吃的世界,开始时细微优势最终将带来无穷多的回报。反之,最初的细微劣势也将导致最终一无所有。这个现象也有人称之为“马太效应”,在圣经《新约·马太福音》中是这样描述的:“ 凡有的,还要加给他,叫他多余。没有的,连他所有的也要夺过来 ”。
我们耳熟能详的帕雷托法则(也就是二八法则)、马太效应都是来自幂律分布。这个数字分布其实有很多点值得我们去思考,你可以尝试多在日常的工作以及生活里用一下它,或许能够给你一些意想不到的惊喜。当然,帕累托法则给我带来最重要的一个认知更新是:每天在我们自己的专业领域里面,或者你的企业在所在的赛道里,只要你比其他人或者其他企业多成功 1%,最终积累起来的竞争优势将使别人无法超越,你就会变成那个能够大声说“我全都要”的少数派。不积跬步,无以至千里;不积小流,无以成江海。
此文章为11月Day19学习笔记,内容来源于极客时间《数据分析思维课》,强烈推荐该课
共有 0 条评论