每天打开数据监控看板,观察当天的业务KPI,已经是互联网人的日常工作内容之一。数据指标的波动对于一个不稳定的企业来说是正常的。波动率分析的本质是通过统计和比较,表达波动率背后的规律和问题。所有的业务数据指标都有一个固定的波动周期,每个周期内数据的变化要趋于稳定。但是,在数据监控系统中的日报、周报、月报中,某个数据指标突然不再满足预期的稳定变化,这就是我们所说的数据异常波动。本文将从以下几个思路为你介绍:
面对波动,先判断数据是否准确。准确性是数据指导决策的基础,日常生活中难免会出现一些问题,比如服务器异常、上游依赖表变化等。,使数据监控平台上出现异常值。还有不同的方法来检查指标的准确性:
绝对值指标:如果是数据中间层或者明细层,通常追溯到日志报告是否异常,报告逻辑是否变化,或者末端接口是否稳定;如果属于应用层数据,通常会检查上游依赖关系是否发生变化,数据口径是否对齐。
率指标:以下矩阵,按分子分母分别检查,参考绝对值指标。
然后在准确的基础上,判断数据波动的幅度,幅度是否异常。波动的衡量通常以同比和环比为基础。周期性是影响数据波动的重要因素。周环比、同比、日环比可以排除周期性的影响,看清数据波动的本质。判断波动是否异常最常用的方法是三西格玛原理。据统计,在正态分布中,99.7%的数据落在3倍标准差范围内,95%落在2倍标准差范围内,68%落在1倍标准差范围内。但也可以通过数据趋势和具体业务中的经验来判断。
在确定了准确性和异常问题之后,进行归因分析和影响度量,最后使用分析结果来驱动业务决策。已经产生的大多数数据波动可以从两个维度进行分类:
范围:包括自己的产品、竞争方面和产品业务的总体环境。之所以这样分类,是因为竞品都处于产品业务的大环境中,任何一方的变化都会引起自身产品的数据变化;
内容:包括产品、技术、用户、运营。这些维度基本涵盖了互联网产品的重要组成部分。日常的波动大部分是自己的模块造成的。归属时,可以从人货场的角度向下钻取:技术维度通常是数据精度的问题,产品和运营维度影响领域,用户因素拆解为买家、卖家、供应商。
外部原因通常很难核实,因为我们很难拿到竞争对手的数据,所谓的第三方报告也不准确。如果竞争对手是上市公司,你可以查看已披露的财报数据,但鉴于某一时刻或时间段的波动,要洞察竞争对手的财报往往有点晚。抛开外部因素,可以从内部因素进行归因,内部因素可以分解为绝对值指标和比率指标。
根据绝对值指标,将归因方法归纳为:横向分析、纵向分析和交叉分析。
横向分析:
人:订单量=自然+外投+推+双方+短信=低活跃度+低中活跃度+中高活跃度+高活跃度=购买力L1+L2+L3+L4+L5 =.......
商品:订单数量=新订单+旧订单=女装+3c+手机+卡券+...=不同卖方价值的订单总和。
纵向分析:
订单数量=dau*曝光转化率*点击到曝光转化率*询价到点击转化率*询价到付款转化率
交叉分析:
订单量=(自然+外向投资+推送+第二方+短信)*(每组下的漏斗转化率)
对于费率值指标,最终转化为绝对值指标的线性组合。
确定影响因素后,就是影响程度的衡量。如果影响指标单一,影响程度明显,但当多个因素同时作用时,业务中没有进行ab实验,各因素的影响程度无法统一。在具体业务中,通常会有行业、大促、节日、创新推广等各种因素的交叉影响。,而ab实验还没有完全进行。这时候影响程度就很难统一了。常见的方法如下:
控制变量法
这种计算方法是选取多个时间维度,与一个固定日期进行比较,然后叠加影响因素。以人均ipv为例,影响因素为活跃pop、运营坑位、外部投资。假设日影响力为零,以上因素都是增量影响力,然后求解方程组得到各因素的影响力权重。
坑分析方法
窖池分析法主要用于分析窖池作业活动对饲料的影响。利用排除原理,重点考虑运营坑的影响程度,然后其他因素为1-影响程度。以人均ipv为例:坑位人均IPv =坑位曝光PV×当日PCTR曝光uv =坑位点击PV/当日曝光UV,坑位贡献率=坑位变化值/总变化值*100%。
先验判断方法
事前判断是基于之前活动的交付效果,将之前的影响效果作为本次活动的影响程度。
边际效应归因
如果策略对kpi有影响,增加或减少策略的强度可以看到观察指标的相应变化。这种方法的代价是时间。通常以长时间的增减力度来判断指数的增减,但要注意同期对比,避免周期性影响。
双重差分法
构建“控制组”的思想要求两组人满足“共同趋势假设”的条件,即当受外界因素影响时,策略组和控制组具有相同的变化趋势。人的策略受策略和其他因素的影响:策略效果= A1–B1,而对照组受其他因素的影响:变化值=a2-b2,则策略效果=(A1–B1)-(A2-B2),但缺点是“对照组”和实验组的样本要尽可能相似。
结语本文是对闲鱼业务波动分析方法和思路的一个总结,主要围绕数据波动判断、波动归因和影响程度衡量。而一天的波动往往需要分析师快速决策,这就需要我们熟悉业务变化,及时关注产品、运营、算法、开发等学员,快速定位问题。以上维度可以作为自动化归属的拆卸维度。