最近常常有小伙伴问我,大概是如下几个问题: 我手里没有多少数据可以供分析,怎么办?我手上有一些数据,但是不知道该如何分析,怎么办?我有一些数据,也知道该做哪些分析,但是不会高大上的工具,怎么办?
对于小喵来说,上面的问题都是伪命题,很多时候,我们做数据时手里掌握的数据总比我需要的多,深入了解业务后,方法总比问题多;方法有了,工具的使用总比想象的简单多~
好了,先看一个栗子吧,看完你就了然小喵为什么这么说咯。
一、背景
话说,某年某月,某外地零食O2O品牌,想要开拓上海市场,本着“稳扎稳打,步步为营”的“精益创业”方针,该品牌准备先在上海几个有代表性的区域进行试运营。
选了3个区域---杨浦区、长宁区和徐汇区,在这3个区人流较大、办公楼密集的区域重点设立了三个实体营业网点,分别位于五角场地铁站、淞虹路地铁站和漕河泾地铁站附近,并以这3个地铁站作为辐射推广点,上下班高峰期在地铁口附近进行DM推广,上班期间则在附近办公楼进行扫楼推广(别问我推广人员是怎么混进去的)。试运营始于七月下旬,到八月下旬正好运行一个月后,是为第一阶段。此时,需要对这段时间的运营数据进行分析,修整并总结经验,着重在以下几个方面进行探讨和研究:
整体的运营情况,包括总订单情况,订单的时段分布情况;
用户的消费行为分析,主要是下单时间分布和购买力情况分析;
总体和各个区域的用户价值分析,用以指导和优化接下来的运营工作。
对比一下这3个地方地推的效果及用户下单情况。
由于前期技术人员太少且负责的项目过多,后台系统过于简陋,后台收集到的原始数据只有下面这些:
原始数据表格
上表是这段时间内,用户下单的信息。注意,同一个User Id可能不止一次下单,可能在不同日期、不同时间段形成多次不同金额的消费,了解这一点对于接下来的用户价值分析至关重要。
好了,各位看官,上面那张表将是小喵接下来炒菜用的“食材”(来源于真实案例,数据会做一定处理,仅作展示数据分析方法之用),没有其他佐料哦(大部分时间使用excel来处理数据)~这些数据看起来平淡无奇,但如果开动脑筋深挖的话,就大有玄机哦。
好了,我们的数据分析之旅即将开始咯!
二、订单时间分布情况
在进行深入分析前,先将原始数据进行初步处理---主要是时间维度的处理。分别调用hour和weekday函数将小时“时点”和“周几”的信息发掘出来,至于“时段”的得来,之前很多小伙伴有问过这是怎样“设计”出来,百度上也搜不出来呐,那当然,这可是我自创的哦~现在小喵贴出一张详情图:
经处理得到若干时间维度数据的表格
“时段”的操作方法
如此这般,即可得到以下关于下单时间分布的信息:
试运营期间订单量时段分布情况
那么,在这张下单时间段分布的图中,又能看出什么苗头呢?其实,很明显的,下单时间只有一个“波峰“---集中在9时~13时,这段时间的小白领除了吃午饭时间是正当的下单行为,其余时间是在”开小差“~
再分析一下试运营期间总体的订单销售情况,将“日期”信息和“星期”信息同时显示在横坐标轴上,更容易发现时间上的下单规律,做成折线图,可以看到如下的结果。
试运营期间整体订单分布情况
从上表中,总体上可以看出,工作日的订单多于休息日的订单,在7-27~7-31和8-3~8-6期间出现订单销售高峰,这2段时间的订单量骤然增长。究其原因,与这3个实体网点做促销活动有很大关系,刺激了目标客户的购买行为。
再单独将“星期”数据“拎”出来,得到下图:
试运营期间一周订单分布情况
从上图可以看出,一周的下单高峰集中在周三、周四这2天,周一和周二的订单量也和这两天相差无几,但是到了周五,特别是周末(周六和周日),订单量就陡然下降。
总的来说,周中的下单量很大,周末的订单量很小,这与白领区的人群消费行为是一致的,无异常情况发生。
得知以上几点信息后,在开展下一阶段的运营工作时,就可以在接下来的运营工作中准备如下事宜:
赶在用户下单高峰时期前,在营业网点安排好人员,做好部署工作,以便及时、快速的将货品送交到用户手中;
在用户下单高峰期到来前一段时间,做好APP和网站的系统维护,以免因下单量大出现技术问题,影响用户体验;
进行下一轮的推广工作时,可以选在周三和周四开展,这2天的用户下单意愿更强烈。
以上关于客户(时间上)行为的分析比较浅显,接下来的客户价值的分析才是“重头戏”呢!
三、客户价值分析
这里的客户价值分析,小喵将用到RFM模型,其中涉及到3个重要的维度,即最近一次消费(Recency)、消费频率(Frequency)和消费金额(Monetary)。
RFM三维度含义
关于这个模型的解释,小喵只搬出某度百科上的关键性语句,想更进一步去了解这个模型的同学自己去网上搜哈~
某度百科上关于RFM模型的原理解释
其中,各个维度的“深层次”含义是:
最近一次消费能显示客户能受到的可能性有多大,最近一次消费的日期距离今天越近,消费者对产品/品牌的印象就越深刻,被广告推送召唤回来的可能性就越大;
客户的消费频次越高,代表客户对品牌或产品的忠诚度越高,当然这种客户也更有维系的价值,即使平时消费金额不多,但谁知道以后会不会有大手笔呢;
消费金额(这里指的是“累计消费金额”)表示消费者的购买力大小,消费金额越大,这种顾客就越优质,当然我们要把他们当宝贝呵护起来~
这种客户价值分析模型虽然很好,但是存在如下几个问题:
每个维度都可以分为5个级别,那么最终的结果是5*5*5=125个分类,客户群分得太细了!每个客户群组都要有一套针对性的方法,但这得要钱要人来做,这样的操作太繁琐、太反人类!
该模型中的F和M两个维度存在多重共线的问题,某一段时间内的消费频次和累计消费金额具有很强的相关性;
一般情况下,R值的权重是3个指标中最大的,但这种判定忽略了客户的消费习惯和消费总量等因素,从而使最终结果的准确性受到某种程度的质疑。
针对以上问题,小喵决定对现有的RFM模型进行一些改良,并祭出“大杀器”---聚类分析,用以简化我们的深度分析工作。
不过,在进行聚类分析之前,需要先预处理下之前的原始数据,除了保留“User ID”、“重点区块”这两个基本信息,还要保留及深度“析出”跟R、F、M这3个维度相关的若干指标:
从“实付金额”这个指标中,通过相关函数进行运算,可以得到“最小消费金额”、“最大消费金额”、“平均消费金额”和“累计消费金额”这4个指标;
而从“下单日期”这个指标,通过相关函数进行运算,可以得到“最初下单日期”、“最后下单日期”、“最初下单日期到今天的间隔天数”、“最近一次下单到今天间隔天数”及“累计购买频次”这5个指标。
重要的分析指标及相关指标的“从属关系”
其中,以上衍生指标的计算公式/方法分别为:
- “最大/最小消费金额”通过公式“=MAX/MIN(IF(原始数据!$A$1:$A$7028=Sheet1!A2,原始数据!$H$1:$H$7028))”得到;
- “最初/最后下单日期”通过公式“=MAX/MIN(IF(原始数据!$A$1:$A$7028=Sheet1!A2,原始数据!$N$1:$N$7028))”得到;
- “累计购买频次”则由透视表得出,同一个User Id下,将任意指标进行“计数”显示,即可得出频次。
- “最后下单到今天间隔天数”由公式“DATEDIF(E2,TODAY(),"d")”得到;最初下单到今天间隔天数由公式“=DATEDIF(D2,TODAY(),"d")”得到,其中E列是最后下单日期所代表的列,D列代表最初(第一次)下单的日期的列。
值得注意的是,上述公式是在新的sheet里构建的,引用的是原始表单里的数据。且后面的间隔天数需要等最初/最后下单日期确定后才能计算出。
最小购买金额计算方法
购买频次的计算方法
将上述指标进行计算后,得到下面的客户信息价值表,可以作为下一步分析的原始数据。
经处理后的客户价值信息表单
然后将该excel表单录入SPSS系统,详细的聚类分析方法,可以参照小喵的上一篇文章:数据运营实操 | 如何用聚类分析进行企业公众号的内容优化。经运算后,可以得到如下新表:
聚类分析后得到的SPSS输出数据
可以看出,上表中多了一列关于“分类”的数据,这就是SPSS软件根据表中用户购买信息(购买金额和购买日期等)在若干维度上的同质性和异质性划分出的4类(由于运营喵使用的是K-means聚类法,需要人为设定分为几类,所以在确定4类之前,需要反复测试2类、3类、5类的数据,直到能在各个分类间体现出明显的差异性,且具有良好的集中度为止)
再用透视表处理一下,将每类数据的“值字段”显示为“平均值项”,得到“用户价值分类特征表“。
用户价值分类特征表
在对上表进行分析之前,小喵需要指出的是:上述指标的重要性不是同一水平的,其中各指标的权重有大有小,重要性不一,而权重系数需要根据以往经验和业务情况进行分配,这里仅给出小喵的判断:
累计购买频次的权重最大,因为多次购买行为即使平均/累计消费金额不多,但反复多次的购买行为代表用户对品牌/产品的认可,能反映出用户的忠诚度;
其次最近一次下单日期,隔得不太久的话,使用客户召回策略的成功率会很高;
然后是平均消费金额,单次高消费或单次低消费都不能准确地反映出客户在本产品上的购买力水平,取历史平均水平才能看出他在本产品上的消费能力,但要结合最低和最高消费金额来看,看是否二者间的差距过大,稳定性如何;
最次是累计消费金额,反映客户在某段时间内累计的消费情况,也能体现客户对产品/品牌的持续价值。
根据上述判断,第2类和第3类属于较为优质的顾客,他们在购买频次、最近一次购买时间、累计消费金额和平均消费金额上的数值水平均衡且较好,是重点需要维护的对象,以后可以对这2类用户推送价值较高的优惠活动/信息,促进其后续的购买行为。
第1类客户属于“土豪级”,虽购买频次较低,但购买金额很大,跟其他几类客户比起来,购买力相当彪悍,有钱可任性,但留住很困难。。。
此外,第4类的用户数较多,是有潜力待挖掘的客户群。这类群体的特征是平均消费金额和累计消费金额低,购买次数较少,且很久未再买产品了,召唤回的概率很小,可以对这部分客户进行回访,找出产品和服务方面存在的问题,做好优化,苦练内功,以便下次进行推广的时候一次就“摁住”客户。
综上,第2类、第3类客户是我们接下来重点抱大腿的目标,这是“节流”;根据第4类客户的回访得到改进产品和服务的建议,在接下来的运营工作中招揽新客户,这是“开源”。
看到这里,你以为结束了?
NO,you too naive~小喵要把数据榨干,尽可能得到对运营工作有用的信息!
以下是经透视表处理后的各区3类用户的占比情况:
各区块3种类型客户的分布情况
上表是各区3类客户分布的情况,从中可以看出淞虹路的总体下单客户量最大,其次是漕河泾,再次是五角场。
此外,由上述数据还可以得出下列概况:
使用excel中的多重判断函数公式,将客户的单次平均消费金额划分为7个档次,函数公式太反人类,小喵就不列了,大家知道原理就好。建议档次别分太多,excel中的if嵌套貌似最多7层。。。
消费金额区间客户数量占比表
由此得到各个消费金额区间的客户占比情况,可以了解到试运营期间客户的整体消费结构怎样。表格看起来不直观,直接转化成下面的2个图,上图定量比较,下图定性分析占比情况。
平均消费金额区间客户数量分布
各消费金额区间客户数量占比情况
在分析上面两个图前,需要指出的是,该O2O零食品牌绝大部分的单件产品的价格在3~15元之间。那么由上述图表可以得知,绝大部分客户下单时,购买不止一件商品,说明连带率(连带率是服装行业销售的一个指标,描述的是顾客在一次购买过程中,同时一次性买走几件商品,它反映了商品的搭配有效性。暴露出身了,小喵是学服装出身的)不错呢,比如客户买香肠的时候同时买了鸡翅、可乐和薯条,说明这样的产品的组合搭配尚可。当然,这还有很大幅度的提升空间呢~
购买频次客户数量分布图
最后是购买频次的客户数量分布图,能反映出用户的忠诚度情况。其中,仅购买过一次的用户占了大头,看到这样的数据,运营人员要思考,为啥这么多的客户只买了一次呢,难道自家的东西不好吃么?所以,以后要好好研究市场,研究客户,研究竞争对手,练好自己的内功。
四、结语
好了,运营喵这次的分享结束了,当然上面还可以使用数据地图,将客户的地点分布做成热力地图,体(geng)现(hao)专(de)业(zhuang)性(bi),以便了解整个客户的区域分布情况,进行有效的二次重点推广,具体操作方法请参考小喵之前的另一篇文章:运营实操|15分钟学会数据地图分析。
从这个例子中,小喵想说的是:当我们拥有一份原始数据时,在结合当前业务的情况下,运用自己的数据分析经验和储备的理论知识,尽量把这些数据“榨干”,汲取有价值、有营养的信息。如此这般,最终的数据/分析报告不仅可以作为我们汇报给领导或相关部门的资料,供他们参考,更重要的是,它能指导和优化我们后续的运营工作,为我们积累宝贵的运营经验。
作者:苏格兰折耳喵,微信公众号:运营喵是怎样炼成的,个人微信:g18818233178),跨境电商运营人,擅长数据分析和可视化表达,对职业规划和内容运营、社群运营有独到的见解。
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)