大型电商平台化妆品分部,用户行为分析
概述:
随着科技和信息技术的不断发展和创新,全球电商进入高速发展时期,仅2019年一年,中国电商总销售额达到2万亿美金,将占全球半额,美国全年在线零售额达到6000亿美金。全国参与网上购物与销售人数总计7亿人次。
根据艾瑞统计数据显示我国网络购物市场交易在过去五年中增速以27.5%复合式增长,远超于社会消费品零售增速。 因此电商平台将作为产品营销的重要平台。但随着我国互联网红利逐渐减小, 新用户增长变得极为困难,已新增客户为导向的盈利逐渐变弱。
因此以数据为基础的用户属性与消费行为数据分析可以帮助电商平台精准定位营销与运营方法帮助电商更好的了解自己的客户,从而大幅度提高销售能力。
简介
本分析对某北美地区某大型销售平台化妆品分店的2019年12月到2020年2月的用户行为数据进行分析。通过交易和产品信息,对平台的经营健康状况进行评估,并同时利用用户记录进行用户管理,达到精准运营和提高平台收入能力的目标。本文分为5大部分个部分
- 数据介绍
- 思维架构&模型方法
- 数据清理
- 数据分析
- 总结
1. 数据介绍:
本项目的数据集来自于一个大型网店化妆品分店的用户行为数据:
- 数据量:1195W
- 时间:2019-12-01 到 2020-02-29
- 数据来源:大型网店化妆品分店的用户行为数据
2. 思维架构&模型方法:
- 电子商务模型
- AARRR模型
- RFM客户价值模型
- 电子商务模型:
从此流程图我们可以清楚的了解基本的电商的客户消费流程和客户渠道获取:
- AARRR分析法&漏斗模型:
通过五个阶段帮助电商更好的理解获客和维护客户
- RFM客户价值模型
通过三个维度体现用户价值
3. 数据处理
- 空值
使用CASE 函数计算数据NULL值和空值:
count(*),
sum(Case When event_time = '' or event_time is null then 1 else 0 end) as NA_event_time,
sum(Case When event_type = '' or event_type is null then 1 else 0 end) as NA_event_type ,
sum(Case When product_id = '' or product_id is null then 1 else 0 end) as NA_product_id ,
sum(Case When category_id = '' or category_id is null then 1 else 0 end) as NA_category_id ,
sum(Case When category_code = '' or category_code is null then 1 else 0 end) as NA_category_code ,
sum(Case When brand = '' or brand is null then 1 else 0 end) as NA_brand ,
sum(Case When price = '' or price is null then 1 else 0 end) as NA_price,
sum(Case When user_id = '' or price is null then 1 else 0 end) as NA_user_id,
sum(Case When user_session = '' or price is null then 1 else 0 end) as NA_user_session
FROM e_commercial;
从空值计算表格可以看出,物品类别代码缺失严重高达98%,但是我们可以使用物品类别代码来代替这一特征,所以我们删除类别代码列,同时品牌的缺失值高达50%左右我们删除品牌列:
Alter table e_commercial drop column category_code;
Alter table e_commercial drop column brand;
虽然产品价值的存在确实值但比例较小占数据总数的0.8%左右,我们选择保留计算留存,在计算RFM时删除。
2.时间单位
时间单位显示为TEXT类型:
建立两个表示时间的列,一个为DATE格式,一个为Timestamp格式拆分原时间表:
ALTER TABLE e_commercial add column date_time VARCHAR(256);
ALTER TABLE e_commercial add column dates DATE;
UPDATE e_commercial SET date_time = timestamp(left(event_time,19));
UPDATE e_commercial SET dates = Date(left(event_time, 10));
4. 数据分析
活跃分析:从2019年12月到2020年2月此电商平台日活在缓慢上涨,但在2019-12-31有异常下降。
异常点分析
- 确认SQL取数公式正确:
#DAU计算
SELECT dates, count(DISTINCT(user_id)) AS Active_User
FROM e_commercial
group by dates
Order by dates;
SQL公式基于UV和日期计算日活,准确无误。
- 维度拆分
周期层面:从每日活跃人数的角度发现,此化妆品网站的日活跃存在趋势性
此电商平台周一开始浏览数量达到顶峰,周二开始逐步下降,在周末时达到浏览量低估。
从平台周期来看,12月31日-周二与12月24日-周二,UV同比减少54%,12月31日,周二的下降并非自然周期下降。
- 客户层面:新客户和老客户对比,新增客户的下降对日活的影响更大
提取新用户数:
select A.Dates AS 日期,count(DISTINCT user_id) AS NEW_C from
(select user_id, min(dates) Dates from e_commercial group by user_id) A
group by dates
having dates BETWEEN DATE("2019-12-24") AND DATE("2019-12-31")
order by dates;
新老客户浏览量从2019-12-24到2019年-12月29日的下降趋势相对统一,从30日起新客户的下降对DAU的影响与老客户拉开差距。
从图可以看出新客户影响系数为0.66,老用户的影响系数为0.34,新客户对DAU的影响远大于老客户, 需要从新客户下手寻找问题从各个渠道入口进行分析。
新用户 = 渠道a+ 渠道b + 渠道c
- 用户行为层面:
从2019-12-24至2019-12-31,网站PV发生断崖式下降,PV环比下降56%,Cart数量环比下降73%,购买数环比下降83%。
从维度分析来看主要是DNU的下降,导致了日活的下降,
内部因素猜测:
渠道方面出现问题,导致客户无法进入浏览页面。
外部因素猜测:PEST分析法
P:网站违规,政府封闭网站入口。
E:重大经济事件的发生导致用户购买行为下降。
S:31日为新年,大部分客户不进行网站的浏览,对手机的粘度下降。
产品&品牌分析
产品分析:5809910为此网站爆款,但产品ID为5560754的产品为最有价值产品,其总销售金额最多。
- 销售价值前五:
#销售价值前五的产品
SELECT sum(price) AS 购买价值, product_id FROM e_commercial
WHERE event_type = "purchase"
GROUP BY product_id
ORDER BY 购买价值 Desc
Limit 5;
#购买频次
SELECT COUNT(*) AS 购买次数, product_id FROM e_commercial
WHERE event_type = "purchase"
GROUP BY product_id;
- 热门商品(购买频次前五):
物品代号5809910的商品在前五中占36%的购买份额,销售价值最高的5560754未出现在购买频次的热门商品中
- 从页面浏览量,购物车添加量和购买量,得知商品5809910为火爆产品
SELECT count(*) AS 个数, product_id FROM e_commercial
WHERE event_type = "Views"
group by product_id
ORDER BY 个数 Desc
Limit 5;
SELECT count(*) AS 个数, product_id FROM e_commercial
WHERE event_type = "cart"
group by product_id
ORDER BY 个数 Desc
Limit 5;
SELECT count(*) AS 个数, product_id FROM e_commercial
WHERE event_type = "purchase"
group by product_id
ORDER BY 个数 Desc
Limit 5;
品牌
除过"无品牌"商品外,Runail的销售件数相比于其他品牌遥遥领先。
#计算购买总件数为前五的品牌
SELECT brand, COUNT(distinct user_id) as purchases_time from e_commercial
where brand!="" and event_type= "purchase"
group by brand
order by purchases_time DESC
limit 5;
从品牌进行分析,我们发现购买频次较高的产品集中在美甲行业。
#总收入前5的品牌
SELECT brand, sum(price) as price_total from e_commercial
where brand!="" and event_type= "purchase"
group by brand
order by price_total DESC
limit 5;
从总交易额来看Runail依旧占据榜首,并且前三名都是美甲产品行业,唯一一家护肤产品厂商UNO排名第五。
美甲产品为此电商平台的头部产品,给平台带来巨大的收入,但同时头部产品品类单一化,对平台的长久发展造成了影响。
解决方法:
加重其他化妆品品类的宣传,例如面膜,口红,以及护肤品。在保持美甲的头部利润的同时加强推荐其他类别产品,从而引导平台多元化发展。同时以头部产品Runail为引线刺激客户的消费例如,品牌的捆绑消费策略。
转化分析
- 总转化率漏斗模型:
页面到购物车转化率一般,购物车到购买页面转化差,表现相对普通
SELECT event_type, COUNT(1) AS Number
FROM e_commercial
GROUP BY event_type;
从漏斗图可以看出,此换妆品分站的页面转化率表现一般为21%,同时购买转化率表现较差,3.506%。此电商的购物车放弃率为86%,在业内表现也相对较差,可以通过运营手段和施行AB-Tests手段减小购物车放弃率。
- 模拟AB Test :提高购物车-购买转化率
- 更改购买按钮位置,提高购物车到完成购买的转化率。
- 确定衡量指标:购物车到购买的转化率
- 时间周期与样本数量确定:周期---为期14天(两个循环周期),样本数量确定(Alpha=0.05, Stats Power=80%, 以往普通转化率22.31%, 目标提升:3% )
4. 使用假设实验--使用Z-test进行试验。
5. 收获结果,进行统计 分析
6. 分析是否上线新版本购物车案件。
- 通过提示的方式发送通知提醒客户购物车物品残留,促进购买。
- 通过对购物车物品的时间的计算进行合理折扣的设定促成购买。
- 使用AB-test优化购物车购买渠道页面
- 添加多种购买方式,和支付方式。
RFM客户价值分析:
此电商的客户主要集中在重点保持用户组,与潜在客户组。
SELECT R.user_id, Recent_date,Frequency,c.Total FROM
(Select user_id, datediff(DATE('2020-03-01'),DATE(a.R_Dates)) as Recent_date
FROM (
SELECT user_id , max(dates) as R_dates
from e_commercial
where event_type= 'purchase'
group by user_id) a) R
LEFT JOIN
(SELECT user_id, count(*) as Frequency
FROM e_commercial
WHERE event_type='purchase'
group by user_id) b
ON R.user_id = b.user_id
Left join
(SELECT user_id, sum(price) as Total
FROM e_commercial
WHERE event_type = 'purchase'
group by user_id) c
on R.user_id=c.user_id
从RFM模型用户分类的效果来看,39%的客户属于重点维持客户,37%的用户为流失用户与潜在用户只有1位客户属于重要价值用户。
流失用户:
大部分用户已经流失,需要小部分的关注度。
重点挽留用
单次购买数额较大,但频次与最近购买评分较低,可以选择推送激活,与电话召回,以及捆包销售的方案对客户进行挽留。
一般保持客户
购买频次较高,但上次购买久远,购买总额不大,可以结合推送和coupon的形式对用户进行消费刺激。
重点保持用户
距离上次消费时间相对较久,可使用邮件推送与短信提示等方法持续激活用户。
高价值用户
需要专员进行1v1服务,进行重点的维护。
留存分析
同比大型电商,此平台留存率表现较差。
SELECT first_date,
count(distinct e.user_id) as 日活跃,
round(count(distinct case when datediff(dates, first_date) = 1 then e.user_id else null end)/(count(distinct e.user_id)),2) as day1,
round(count(distinct case when datediff(dates, first_date) = 6 then e.user_id else null end)/(count(distinct e.user_id)),2) as day7,
round(count(distinct case when datediff(dates, first_date) = 29 then e.user_id else null end)/(count(distinct e.user_id)),2) as day30
FROM e_commercial e
Left Join
(SELECT user_id as id, min(dates) as first_date
FROM e_commercial
group by user_id) t
on e.user_id = t.id
group by first_date;
从折线图来看,此平台次日留存的平均水平在6%,30日留存跌至1%左右。虽然化妆品购买周期相对较长,但用户留存表现很差。
建议优化:
- 建议电商平台采用VIP,或者积分制度,签到领券活动来培养用户的平台登陆习惯。
- 给于第一次购买用户折扣,给与下次购买的动力。
复购率分析(90天)
本电商平台90天复购率达到18.16%
#90天复购
Select count(user_id),
count(if (times>1,1,null)) as num_again,
count(if (times>1,1,null))/count(user_id) as RR_12
FROM(
SELECT user_id, count(distinct user_session) as times
from e_commercial e
where event_type = "purchase"
group by user_id) t;
90天复购率高于15%,达到18.16%,表现良好。
证明该平台还处于混合经营模式,需要平衡在新用户转化和老用户留存,复购上的精力和资源。--精益数据分析
策略:
- 会员卡机制,提高忠诚用户转化。
- 基于用户画像,和购买的产品周期进行产品推荐
- 周期性推荐,硬件推荐。
总结
- 201-12-31日,DAU大幅度下降从多维度分析发现主要原因是因为DNU的大幅度下降,同时DOU也有明显下降,主要是因为过年期间用户对手机或互联网的依赖下降,导致各个渠道DNU下降。
- 从产品出发,物品代号5809910的商品在前五中占36%的购买份额,销售价值最高的5560754未出现在购买频次的热门商品中,电商平台可以考虑用头部物品使用捆包销售的策略带动尾部产品的售卖。
- 从品牌分析发现,此化妆品电商的头部化妆产品是美甲产品系列,销售量前五的品牌均为美甲行业,销售总额前四为美甲行业,第五为UNO皮肤管理产品,建议加重其他化妆品品类的宣传,例如面膜,口红,以及护肤品。在保持美甲的头部利润的同时加强推荐其他类别产品,从而引导平台多元化发展。同时以头部产品Runail为引线刺激客户的消费例如,品牌的打包消费
- 此化妆品电商的页面转化率表现一般为21%,同时购买转化率表现较差,3.506%。此电商的购物车放弃率为86%,在业内表现也相对较差。可使用AB-test优化购买键位。从运营的角度:通过提示的方式发送通知提醒客户购物车物品残留,促进购买。通过对购物车物品的时间的计算进行合理折扣的设定促成购买。添加多种购买方式,和支付方式等。
- 从RFM分析模型发现,此电商客户集中在重点维护用户与流失用户群体
- 建议使用邮件推送与短信提示等方法持续激活重点维护用户。
- 使用用户找回,和打折券组合的方式挽回流失用户。
- 从留存率来看,但用户留存表现很差,平台次日留存的平均水平在6%,30日留存跌至1%左右。
- 建议电商平台采用VIP,或者积分制度,签到领券活动来培养用户的平台登陆习惯。
- 给于第一次购买用户折扣,给与下次购买的动力。
- 复购率达到18%,为新老用户的混合经营模式,在同级别电商表现相对较好。
- 会员卡机制,提高忠诚用户转化。
- 基于用户画像,和购买的产品周期进行产品推荐
- 周期性推荐,设置持续登陆奖励。
Reference