母婴销量数据分析报告

数据分析报告分为六大部分:

分析背景和目的

字段含义的理解

提出问题以及分析思路

数据清洗

建模分析及数据可视化

结论以及建议

下面就围绕这六个部分展开。

一、分析背景和目的

随着国家开放三胎政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度分析,分析市场需求,定位产品方向,从而在满足市场需求的同时,提高销量。

数据源来自阿里巴巴天池淘宝母婴购物数据集https://tianchi.aliyun.com/dataset/45,本数据集包括2个excel文件:

表1购买商品信息表:总共有29971条交易记录,交易记录的时间是从2012年7月2日到2015年2月5日。MIN(G:G) MAX(G:G)

表2婴儿信息表:总共有953条记录

二、字段含义的理解

表1购买商品字段

User_id:用户ID,Auction_id: 订单ID,Cat_id:二级类目,Cat1: 用户购买产品所属的一级类目,Property:产品属性,Buy_mount:购买的产品数量,Day:购物日期

表2婴儿信息表字段

User_id:用户ID,Birthday: 婴儿的出生日期,Gender:性别(0 男性;1 女性)

三、提出问题以及分析思路

婴儿年龄与销量的关系?

婴儿性别与销量的关系?

婴儿年龄与性别共同作用对销量的影响?

老客户对总销量的影响?

老客户偏爱的产品类型?

不同类别商品之间的比较,每一种产品的销量、单次购买数量、男女占比、受众年龄之间的差异?存在的爆款?

销量与时间的关系,销量高峰与低谷出现的原因,销量高峰阶段的热销产品类型?

四、数据清洗

将两张表合并成一张表vlookup

将列字段名重命名为中文

重复值检查

缺失值检查

一致化处理,将日期字段通过分列的方式转换成日期格式;增加一个字段“宝宝年龄”,用datedif计算出时间间隔;增加一个字段“宝宝性别”,用if嵌套if标记出“女生”“男生”“未知”;用countif函数计算出用户id出现的次数,再用if函数把出现次数等于1的标记成新客,其余的标记成老客。

异常值处理,对购买日期和婴儿出生日期间隔时间以及单次购买数量进行异常值的排除,首先对购买日期和婴儿出生日期间隔时间进行异常值的筛选:

根据计算,间隔月超过120的即为极度异常值。间隔超过120个月的总共有四条记录,但是除了间隔为339个月明显是不合实际情况以外,其余的异常值还是在合理范围内,所以进行保留,只删除间隔月为339的记录。

最后,数据清洗完毕

五、建模分析以及数据可视化

性别对销量的影响

在总销量中,男婴的销量占比比女婴高出26%。

于是我们接下来用多维度拆解分析方式,从男女的用户数量和单次购买数量进行对比分析。

在全部用户中,购买男婴产品用户的比例仅仅是略微高于女婴的比例,所以男女的用户数量并非主要矛盾。

接下来看看男女用户单次购买数量是否有较大的差别。

通过男女单次购买数量的对比,我们可以明显看到,男婴单次购买数量远远高于女婴,并且单次购买数量高达1.9,接近2,然而女婴的单次购买数量只有1.3件,说明购买男婴产品用户的消费能力更强,也说明了产品对女婴受众的需求还未能较好的满足。

目标受众的年龄分布

目标受众主要是1岁孩子的父母、2岁孩子的父母以及怀孕中的父母,只有较少的父母会在还未怀孕时就提前购置相关物品。

那么处于不同年龄段的不同性别的婴儿,目标受众是否有较大差异呢?

从图中可看出,只有怀孕中的父母会更多地会为女婴购买产品,其余所有年龄段孩子的父母都是更多地为男孩购买产品,但是两者差异不大。但是当孩子大于3岁以后,为男孩购买产品的父母数量远远高于为女孩购买产品的父母数量。

不同性别不同年龄的受众群体,单次购买数量是否也有明显的差异呢?

同样地,怀孕中的父母不仅会更多地为女孩购买产品,而且每笔订单中的数量会略高于男孩。除此以外,男孩父母都会买更多的产品,会在未怀孕时就为男孩购买超3件产品,为1-2岁男孩购买超2件产品,而大多数父母只会为女孩购买1-1.5件产品。

新老客户对销量的影响

总销量=新客户的销量+老客户的销量,我们看看老客户是否对整体销量起到比较大的影响。

老客户的销量=老客户的数量*老客户单次购买的数量

接下来,我们从多维度拆解分析的方法,从老客户的数量以及老客户单次购买的数量去看看老客户对整体销量的影响。

在全部用户当中,老客户的数量仅仅占到0.17%,数量少之又少。

从单笔订单的购买数量来看,老客户略微高于新客,仅仅是高出0.1左右。再加上老客户的占比极少,所以可得出一个结论,复购率低,老客户对总销量的影响微乎其微。

老客户到底更偏爱什么产品?如何才能留住老客户提升留存率呢?

若要提升用户黏性,就要了解是什么能够留住老客户。

从产品的角度来看,老客户购买产品数量最多的是50008168,其次是38和28的产品。

不同类别商品之间的比较

总共有6种产品类型,每一种的销量情况以及单次购买数量的情况如何呢?

从总销量来看,28最热卖,其次是50008168和50014815。

28产品销量最高,单次购买数量高,超过2件,且是老客户偏爱的产品。

虽然38产品的总销量一般般,但单次购买数量极高,超过了3,并且也是老客户偏爱的三个产品类型中的一种。由此可得知,38产品类型若能加大推广力度,精准定位人群,能够带来很大的增量。

5008168是热卖产品类型,但单次购买数量倒数第二,远远不到1.5,远远低于平均水平。再加上5008168是老客户偏爱度排第二的产品,可得知这个产品类型应属于易耗品,客户虽单次购买少,但客户群体庞大,回购需求高。

不同类别之间的男女占比是否有较大的差异呢?

除了50022520产品类型是女孩受众数量多于男孩以外,其余均是男孩多于女孩。其中50014815有非常明显的性别倾向,男孩购买数量远远高出女孩购买数量,男孩受众用户数量接近350,女孩受众用户数量仅仅刚超过100。

一级类目下的二级类目产品有哪一些爆款呢?

总共有662款产品,但是销量前7的产品销量占到总销量的26.24%。

50022520和122650008这两个类目不仅整体销量低,单次购买数量少,而且没有爆款存在,属于差评产品类型。

38产品类型有一款爆款211122,这个爆款的销量就占38所有产品销量的56%。所以推广38的产品类型时,应主要集中在211122产品上。

50008168总销量高,单次购买少,回购多,爆款多。

不同产品类型,其受众的年龄是否有所不同呢?

不同类目中,受众年龄分布并不一致:

28受众中1岁最多,38受众中2岁最多。

50008168受众分布相对平均,大于3岁最多。

50014815受众绝大多数是1岁,且再结合上面对性别的分析,可得出50014815的受众主要是1岁的男孩。

50022520受众中怀孕中的父母最多。且再结合上面对性别的分析,可得出50022520整体的受众人群很少,主要购买人群集中在怀孕中的父母,且是购买给女婴的数量多于男婴,非老客户偏爱产品类型,也无爆款存在,属于差评产品类型,不应成为推广中的重点,可尝试精准营销,只针对怀孕中的父母进行推广。

122650008受众整体最少,且各个年龄段受众都极少,说明市场潜力小,可考虑用新产品类型进行替换。

销量与时间的关系

从总销量来看,2012-2014呈现上涨的趋势,但是2015年呈现一个下降的趋势。

到底为什么2015年销量会呈现下降趋势呢?,用假设检验分析方法寻找2015年销量下降的原因。

假设:由于2015年销量数据不完整导致数据呈现下降趋势

收集:由于2012年没有1月份的数据,所以对2013-2015年1月份的销量以及2012-2015年2月份的销量数据进行对比分析

2015年1月份的销量相比起2013和2014年而言有着较大的涨幅。

2014年2月份的销量比2013年2月份的销量高出许多。

按照合理的预计,2015年2月份的数据也应该高于2013年和2014年的数据,但是结果却跟2013年2月份相差无几。

但是,从数据记录本身来看,2013年和2014年2月份都有28天的完整数据,而2015年2月份只有5天的数据。并且这5天的数据与2013年28天的销量相差无几。

结论:假设成立,是数据的不完整性造成2015年销量呈现下降趋势。实际上,2015年1月份的销量比2013年和2014年的销量都高出两倍,2015年销量是呈现上涨趋

总销量随着时间会发生怎样的变化呢?

总销量随时间的变化呈现一定的规律。5月份是销量的小高峰,11月份是整年销量的巅峰,1月份至2月份是销量的低谷。

用假设检验分析的方法找到这三个现象的原因。

假设:是促销活动的原因导致11月份销量达到巅峰。

收集证据:2012-2014年11月份的具体销售数据

结论:2012-2014年11.11号都到达了整年销售的巅峰,根据我们惯常知道的双十一活动,可以确定假设为真,是双十一的促销活动导致11月份销量达到巅峰。

进一步分析,十一月主要销量集中在哪些品类?

从图中可看出,28和50008168品类每年十一月份同比涨幅比较大,预计2015年11月份这两个品类能有更高的销量。反而是50014815从2012年11月份销量领先,结果变成2013和2014年11月份销量停滞。那么到底为什么50014815的销量会出现停滞不前的状态?

假设1:50014815已经达到一个相对巅峰的状态

假设2:50014815具有季节性特征,销量巅峰在其他月份

证据:收集50014815在2014-2015年的销售数据

结论:从图中可以看出,50014815每年的销量巅峰都在11月。

因此,假设1成立,假设2不成立。50014815的销售旺季就在11月份,销量在2012-2014年11月份已经达到一个相对巅峰的状态,市场开发潜力有限,不应成为推广重点。但是可以看出,50014815在2014年Q2和Q3的销量相比起2012和2013年有较大的涨幅,所以50014815的推广重点不在于突破更高的巅峰,而在于挖掘其在其他季度的潜力。

分析5月份的销量小高峰的原因。

假设1:有促销活动带动5月份整体销量

证据:收集2013-2014年5月份的具体销量情况

2013/5/12:母亲节 2014/5/11:母亲节5.20 情人节 6.1 儿童节

结论:节日时间与销量高峰期比价吻合,所以假设成立。因为5月份节日集中,所以促销活动也较多,销量上涨正好与节日活动的时间相吻合,所以是促销活动带动5月份达到全年的一个小高峰。

那5月份和11月份是两个重要的销售旺季,热销产品是否有些许不同?推广是否侧重点也有不同呢?

通过对比5月份和11月份各个类目的销量,我们可以明显看到:

虽然50008168和28都是占比最高的两个产品类型,但是5月份50008168的销量高于28,11月份28的销量高于50008168,所以,在不同的销售旺季,推广重点需略有侧重。

1至2月份为什么销量会进入一个低谷呢?

假设:春节快递停运造成

收集证据:观察1月份和2月份,看看销量下降的时间与春节时间是否吻合

2013年春节:2.10,2014年春节:1.31,2015年春节:2.19,2013年低谷期:2.2-2.17,2014年低谷期:1.26-2.3,快递会在春节前一周左右开始停运,在春节开始后一周左右恢复。

结论:2013和2014年销量的低谷期与春节快递停运的时间非常吻合。而2015年的春节还未来临,所以还未出现销量的低谷。

所以假设成立,的确销量低谷是由于春节快递停运造成。由于2015年的春节在2.19,所以预计在2.12前后会出现销量的低谷,低谷持续一周到两周,然后销量再回升。

六、结论和建议

1.购买男婴和女婴产品的用户数量相差无几,但男婴单次购买数量远远超出女婴。在推广过程中,针对女婴父母,可通过捆绑营销的方式提升单次购买女婴产品的数量,而针对男婴父母,可加大推广力度以促成更多单次购买数量高的订单。

2.怀孕中的父母,以及1岁和2岁孩子的父母是主要受众人群,也就是推广的主要对象。针对怀孕中的父母,要更多地推广女婴产品,因为选择在怀孕时为女孩购买相关产品的父母多于为男孩购买相关产品,并且单次购买的数量更高。

3.复购率较低,可通过提升50008168,38以及28产品类型中的产品数量、质量、用户体验等等方式来提升用户粘性。

4.28、50008168和50014815的产品类型销量占比最高,是主推的产品类型。

28产品销量最高,单次购买数量高,超过2件,且是老客户偏爱的产品,受众中1岁最多,是推广中的重点。38产品的总销量排第四,离销量前三差距较大,但单次购买数量极高,超过了3,受众中2岁最多,是老客户偏爱的三个产品类型中的一种。由此可得知,38产品类型若能加大推广力度,精准定位人群,能够带来很大的增量。38产品类型下的爆款211122占38产品销量的56%,所以推广38时主要集中在211122产品上。50008168总销量高,回购多,爆款多,而且受众的年龄分布相对而言较平均,大于3岁最多,这个产品类型是推广中的重点。但是,单次购买少,可以用此热款去捆绑单次购买量高的冷款产品(如38),提升成交订单数的同时也能提升每笔订单的产品数量。50014815受众非常精准,受众是1岁男孩,销量占比为第三。50014815销量在2012-2014年11月份已经达到一个相对巅峰的状态,连续几年11月份销量都没有太大涨幅,市场开发潜力有限,不应成为推广重点。但是50014815在2014年Q2和Q3的销量相比起2012和2013年有较大的涨幅,所以50014815的推广重点不在于突破更高的巅峰,而在于挖掘其在其他季度的潜力。50022520整体的受众人群很少,主要购买人群集中在怀孕中的父母,且是购买给女婴的数量多于男婴,非老客户偏爱产品类型,也无爆款存在,属于差评产品类型,不应成为推广中的重点,可尝试精准营销,只针对怀孕中的父母进行推广。122650008受众整体最少,且各个年龄段受众都极少,单次购买数量少,说明市场潜力小,可考虑用新产品类型进行替换。

5.销量前7的产品销量占到总销量的26.24%, 分别50018831、50013636、211122、50011993、50006602、50010558和50013207。可以将爆款产品与其他产品进行捆绑营销,满赠等促销活动。

6.2015年,总销量呈现上涨的趋势。其中,由于5月份节日多以及11月份有大型的双十一促销活动,这两个月的销量会有大幅度的飙升,需要提前备好货源。

在这两个月份里,销量最多的两个产品类型都是28和50008168。但是在5月份,50008168销量大于28,而在11月份,则是28大于50008168,所以在两个不同的销售旺季应有所侧重。

7.2015年的春节春节在2.19,所以预计在2.12前后会出现销量的低谷,低谷持续一周到两周,然后销量再回升。

版权声明:
作者:Zad
链接:https://www.techfm.club/p/54729.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>