常用的数据分析方法(4)
RFM是3个指标的缩写: 最近1次消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary),通过这3个指标对用户分类的方法称为RFM分析方法。这里举个例子来说明这3个指标是什么意思。你有一家店铺,小明是这家店铺的用户,今天是这个月的30号。(1)最近1次消费时间间隔(R)是指用户最近一次消费距离现在多长时间了。小明最近1次在店铺买东西是这个月26号,上一次消费距
七. 群组分析方法
1.什么是群组分析方法?
“群组分析方法”(也叫同期群分析方法)是按某个特征,将数据分为不同的组,然后比较各组的数据,说白了就是对数据分组然后来对比。

2.群组分析方法有什么用?
产品会随着时间发布新的版本,产品改版的效果如何?版本更新后用户是增长了,还是流失了?
像这类问题,就需要将用户按时间分组,然后比较不同组的用户留存率。
留存问题中如何对用户分组?
通常是按用户开始使用产品的月份来分组,例如用户注册的那个月或者第1次购买的那个月。
分组后,考察每组用户的留存率随着时间发生了哪些变化,例如1个月后留存率是多少,2个月后留存率是多少。对留存率高的用户组,分析他们为什么留存:对留存率低的用户组,分析他们为什么流失。

3.如何使用群组分析方法?
3.1 案例1:视频平台用户流失分析
你肯定用过腾讯、优酷、爱奇艺等视频平台,这类视频平台的用户是按月付费成为会员才能看某些电视剧。用户可以在任意月份取消订购,这类取消订购的用户就是流失用户。为了分析用户为什么流失,我们可以使用群组分析方法。
表格的第1列“分组”是按新用户注册的月份分组,每一行是对应组之后各个月留存下来的用户。

现在来计算这个表格里的留存率。拿“1月份组”这一行来说,1个月后的留存率=留下的人数(140)/1月份组总人数(150)=93.33%,2个月后的留存率=留下的人数(130)/1月份组总人数(150)=86.67%,如图所示。

当群组分析表格里的数据较多,直接分析比较困难。这时可以把各个组的数据绘制成折线图,这样就可以很容易地发现数据随时间发生了哪些变化。
把每个组的数据绘制成一条折线,横轴是时间,纵轴是留存率,然后比较各个组的折线。因为9月份组和10月份组的数据很少,所以没有绘制到图上。从图中可以发现,当1、2、3月份组的折线趋于平稳时,4、5、6月份组的折线还在继续下行。

通过群组分析方法,我们发现留存率低的是4、5、6月份组。接下来就可以继续分析为什么这3个月的用户留存率下降。例如,有可能是下面几种原因:
(1)公司最近上线了新功能,但是这些新功能并不适合新用户:
(2)公司最近推广活动带来了新用户,但是公司的产品对这些新用户没有价值,导致用户流失。
这时就可以使用前文的假设检验、相关分析等方法来进一步研究,找到问题发生的原因。
最后我们复盘下用户流失分析这个案例。
第1步,使用群组分析方法,找到留存率低的组;
第2步,分析为什么这些组留存率低,可以使用假设检验、相关分析等方法进一步研究。

3.2 案例2:推特用户留存分析
前面在使用“群组分析方法”时,一般按用户开始使用产品的月份来分组,但这不是唯一的分组规则。工作里业务场景不一样,需要灵活根据业务需求来确定分组规则。
现在来看看推特团队是如何使用“群组分析方法”来发现留存率低的问题,以及如何分组的?
推特是国外版的“微博”,在发展的早期阶段,团队通过数据分析发现,在新用户注册时,根据用户的兴趣选择,向他推荐30个最可能感兴趣的账号,这样才可以使新用户成为长期活跃用户。那么,为什么是关注“30个”用户账号呢?
这个数据可不是团队一拍脑袋决定的,而是使用群组分析方法得出的结论。
当时,推特面临的是很多人注册后就不再使用产品了,留下来的活跃用户极少。为什么用户留存率低呢?为了解决这个问题,团队按每月使用推特的天数对用户进行分组分析。由于没有当时的真实数据,为了方便理解,表中的数据是模拟数据。

“分组”这一列是某月份用户使用推特的天数,“当月用户数”这一列是对应这组里有多少用户,“1个月后用户数”是1个月后,有多少人留存下来继续使用产品。这样分组后,用“1个月后用户数”除以“当月用户数”,就可以得到各组的留存率。

将最后一列的留存率绘制成折线图,比较各组的留存率变化。其中,横轴是各个组,也就是这个月使用产品的天数,纵轴是每个组对应的留存率。
从图中可以看出,当月使用推特7天是一个拐点,这之后留存率慢慢稳定在90%以上。

那么,一个月使用至少7天的用户比例高吗?
推特团队将用户分为三组,分组规则如下:
(1)核心用户,也就是每个月至少访问7天的人;
(2)一般用户,也就是使用产品不那么频繁的人:
(3)冷漠用户,也就是使用一次产品后就不再用的人。
分组后统计每一组的用户比例,推特团队发现核心用户有20%,这个比例是比较高的。

核心用户组为什么留存率高呢?
推特团队通过相关分析发现,关注人数和留存率高度相关。当用户关注人数在30人以上,用户就会留存下来。通过继续深入分析,推特团队又找到了一组相关关系:用户关注的30个人里有多少人关注他们和留存率高度相关。

为什么回关人数越多,用户留存率越高呢?
团队对用户进行了电话采访,发现了这背后的原因:
如果不到1/3的人“回关”,那么推特就会像一个新闻网站,而市面上还有很多其他新闻网站可以选择;
如果超过1/3的人“回关”,那么推特就跟其他社交产品没有什么区别,例如微信中大家都是互相关注的状态,也没法体现出推特的独特之;
只有达到1/3这个比例的时候,才能体现出推特的特点,也就是让用户及时了解他们关心的圈子里发生的新鲜事。
通过使用群组分析方法和相关分析方法,推特团队找到了用户留存率低的原因。最后,他们利用分析结论优化了产品,就是在新用户注册的时候,根据用户的兴趣选择向他推荐30个他最可能感兴趣的账号,这样才可以使新用户成为长期活跃用户,
现在复盘下前面的两个案例,就可以总结出使用群组分析解决问题的模式:
在分析用户留存或者流失问题的时候,可以先使用群组分析方法找到留存率低的组:然后使用假设检验、相关分析等方法,分析这些组留存率低的原因。还可以先使用群组分析方法找到留存率高的组,然后分析为什么这些组留存率高。
例如,可以将腾讯视频里的用户按照观看时间来分组,发现留存率高的用户喜欢看某些类型的电视剧,那么就可以在产品主页里主推这类电视剧。

八.RFM分析方法
1. 什么是RFM分析方法?
RFM是3个指标的缩写: 最近1次消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary),通过这3个指标对用户分类的方法称为RFM分析方法。
这里举个例子来说明这3个指标是什么意思。你有一家店铺,小明是这家店铺的用户,今天是这个月的30号。
(1)最近1次消费时间间隔(R)是指用户最近一次消费距离现在多长时间了。小明最近1次在店铺买东西是这个月26号,上一次消费距离现在过去了4天,所以小明的最近1次消费时间间隔是4天。
(2)消费频率(F)是指用户一段时间内消费了多少次。如果对“一段时间”的定义是最近30天,发现小明最近30天在店铺消费了2次。
(3)消费金额(M)是指用户一段时间内的消费金额。如果对“一段时间”的定义是最近30天,发现小明最近30天总共在店铺消费5000元。
这3个指标针对的业务不同,定义也不同,要根据业务来灵活定义。各指标特征如下:
对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高。
对于消费频率(F),购买频率越高,也就是F的值越大,用户价值越高。
对于消费金额(M),消费金额越高,也就是M的值越大,用户价值越高。
把这3个指标作为坐标轴,就可以把空间分为8部分。

2.如何使用RFM分析方法?
第1步:计算R、F、M的值。
要得到R、F、M这3个指标,一般需要数据的3个字段:
用户ID或者用户名称、消费时间、消费金额。从这3个字段可以计算出R、F、M这3个指标。
以图中的原始数据为例,假设现在是2025年1月30日,分析最近30天的用户。其中,小明最近一次消费是2025年1月26日,与今天(1月30日)的间隔是4天。他在最近30天消费了2次,
用这个方法,计算出表里两位用户的R、F、M值。
第2步:给R、F、M值按价值打分。
对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高。

将R、F、M 3个指标分别按价值从小到大分为1~5分。
这个案例里,对于最近1次消费时间间隔(R),大于20天的打1分,10~20天的打2分,5~10天的打3分,3~5天的打4分,3天以内打5分。
把这3个指标的打分规则,整理到表里。实际业务中,如何定义打分的范围,要根据具体的业务来灵活掌握,没有统一的标准。

根据打分规则,可以对表计算出的R、F、M值进行分类,在最后3列填上对应的分值,如表所示。

第3步:计算价值平均值
分别计算出R值打分、F值打分、M值打分这3列的平均值,如表所示

第4步:用户分类。
在表格里增加3列,分别用于记录R、F、M3个值是高于平均值,还是低于平均值。如果一行里的R值打分大于平均值,就在R值高低列里记录为“高”,否则记录为“低”。F值、M值也这样比较。

总结下前面的内容,用RFM对用户分类的过程如下:
(1)使用原始数据计算出R、F、M值;
(2)给R、F、M值按价值打分,例如按价值从低到高分为1~5分;
(3)计算价值的平均值,如果某个指标的得分比价值的平均值低,标记为“低”。如果某个指标的得分比价值的平均值高,标记为“高”
(4)和用户分类规则表比较,得出用户分类。
用户分类后,如何精细化运营呢?
(1)重要价值用户,RFM三个值都很高,要提供VIP服务;
(2)重要发展用户,消费频率低,但是其他两个值很高,要想办法提高他的消费频率;
(3)重要保持用户,最近消费时间距离现在较远,也就是R值低,但是消费频率和消费金额这种用户,是一段时间没来的忠实客户。应该主动和客户保持联系,提高复购率;
(4)重要挽留客户,最近消费时间距离现在较远,消费频率低,但消费金额高。这种用户即将流失,要主动联系用户,调查清楚哪里出了问题,并想办法挽回。
3.注意事项
(1)R、F、M指标在不同业务下定义不同,要根据具体业务灵活应用。
举个例子,你现在是滴滴打车的一名运营人员,如果用RFM分析方法对用户进行分类,你会如何定义R、F、M这3个指标呢?
对应这里的业务,R可以定义为“上一次打车距离现在多少天”:F可以定义为“过去30天的打车次数”:M可以定义为“过去30天内打车的总金额”
为什么F不是“历史打车总数”呢?因为滴滴打车满足的是用户高频的短途出行需求,如果用户连续一个月未使用,即可定义为流失用户,所以“一段时间”可以定义为“最近30天”如果是滴滴的代驾或者货车业务,是低频的需求,可以把“一段时间”定义为“一年或者1个季度”。
(2)R、F、M按价值如何确定打分的规则。
分值一般分为1~5分,也可以根据具体业务灵活调整。每个分值的范围要根据具体业务来定,就好比你在开车,车速控制在哪个范围,可以根据路况灵活把握。
此外,FRM打分的规则可以与业务部门沟通,进行头脑风暴。或者使用聚类的方法对R、F、M的值进行分类,然后给每个类别打分。
更多推荐


所有评论(0)