异常波动分析

关于拆解的维度与指标问题: - 对于乘除型指标,先分析拆解的指标,找到异常的子指标后,估计哪个子指标的影响度大,然后就继续下钻,直到拆解成最细粒度后,拆解维度,再去衡量中国指标不同维度的影响度或者波动贡献率,定位到最细关键点。 - 对于加减型指标,就直接拆维度吧。 - 当然,也有对于比例指标直接拆维度计算影响度的方法,反正先指标后维度还是先维度后指标其实都行。 **先拆指标,后拆维度** # 1、指标拆解方法 拆解的方法为杜邦分析,示例如下: ![image.png](https://cos.easydoc.net/17082933/files/kzjh3ws7.png) > 杜邦分析法的好处就是,当**下钻**到拆解的某一个点的时候,问题就被定位到了,否则只定位到会话量,这样是不可以的。分析的维度一定要能落地到可以改善具体问题的那个最小点。 比如别人看到你分析的交易用户下降之后,他们就知道到底是要去找渠道组去谈渠道质量变差了?还是应该去跟城市的区域经理谈是哪个城市做得不好?还是应该跟用户运营的团队去谈怎么那么多用户都流失了?还是要去跟负责用户增长的部门谈说最近用户增长怎么那么乏力? 如果没有这样的一个层层拆解,就很难有一个定位异常波动问题的分析框架,那么就会导致每天都要把这些数据重复的提取出来,从而导致很难去做固化,如果有进行层层的拆解分析的框架,并且把这些内容全部固化成监控的仪表盘之后,如果有出现异常波动,那么只要回查一下搭建的仪表板,就能快速的告诉老板到底是由于哪个原因引起的,然后就可以快速的相应老板的诉求,不至于说一直在那边跑数而导致效率特别低。 # 2、贡献度的衡量 将变化的量分解到相关的最细粒度指标,对比前后2个时间段上最细粒度指标的变化,明确是哪一个指标的波动对这个指标的波动贡献度最大。 比如:询盘量转化率上升,而询盘量转化率=询盘量/会话量,细分转化率的上升是询盘量的上升导致还是会话量的下降导致,各自贡献的比例为多少? ## 2.1 [连环替代法](https://zhuanlan.zhihu.com/p/156843026) **询盘转化率的波动=询盘转化率2-询盘转化率1=询盘量2/会话量2 -询盘量1/会话量1** 假设在询盘量不变的情况下: **会话量对转化率的波动贡献=询盘量1/会话量2 -询盘量1/会话量1** 假设在会话量不变的情况下: **询盘量对转化率的波动贡献=询盘量2/会话量2 -询盘量1/会话量2** 示例: ![image.png](https://cos.easydoc.net/17082933/files/kzjharig.png) > 关于计算的先后导致结果不同的问题可以去蓝色标题链接看看 ## 2.2 对数变换 > 段落引用对于乘法/除法类指标,使用对数变换,将乘法/除法类指标转换为加法/减法,再确定各因素对结果都影响数(++该方法不知可行不可行,存疑++) 1. 基期N=ABC(ABC之间也可以是除法关系),实际期N'=A'B'C',其中N'=N(1+n),A'=A(1+a),B'=B(1+b),C'=C(1+c); 2. 对N'=A'B'C'取对数可得:lgN+lg(1+n)=lgA+lg(1+a)+lgB+lg(1+b)+lgC+lg(1+c); 3. 因为lgN=lgA+lgB+lgC,所以lg(1+n)=lg(1+a)+lg(1+b)+lg(1+c); 4. 现在计算a因素单独变动带来的影响数:Na=lg(1+a)/lg(1+n); 5. 依次计算b因素、c因素的影响数,得Nb、Nc; 示例: ![屏幕截图 20220212 151347.jpg](https://cos.easydoc.net/17082933/files/kzji65o9.jpg) # 3、单指标多维度的分析 能在一个指标能拆分成的多层树状结构中,具体是哪一层的哪一个节点的波动对这个指标的波动贡献度最大? 比如:以询盘量的上升为例,可以如下进行拆分: ![image.png](https://cos.easydoc.net/17082933/files/kzjih5lo.png) ## 3.1 加减类 单一指标的影响数 1. 基期N=a+b+c(abc之间也可以说减法关系),实际期N'=a'+b'+c',差额=N'-N; 2. 现在计算a因素单独变动带来的影响数:Na=a'-a; 3. 依次计算b因素、c因素的影响数,得Nb、Nc; 4. 差额=N'-N=Na+Nb+Nc; 5. 确定影响占比,a因素占比Na/(N'-N),b因素占比=Nb/(N'-N),c因素占比=Nc/(N'-N),结束工作。 示例: ![image.png](https://cos.easydoc.net/17082933/files/kzjizfq3.png) > 不过他算的是贡献度,不是影响占比;这二者的区别暂时还不清楚,不过他们各自的和都是1,所以一定程度上越等吧我感觉。 ## 3.1 加减类 比例指标的影响数 携程-阿狸与小兔-公众号的方法 ![image.png](https://cos.easydoc.net/17082933/files/kzjj05px.png) > 同样算的是贡献度,不是影响占比 # 知乎文档示例 ![屏幕截图 20220212 205951.jpg](https://cos.easydoc.net/17082933/files/kzjuklop.jpg) > 这个方法能够定位到问题,但缺点是:数据是不精准的。具体参见连环替代法。这种假设其他变量不变就自己在变,最后得到的缺口数值加起来不会等于全部的缺口数。但这个其实可以参考用携程的哪个影响数来解决,当然如果业务方无法解释的话,可以用知乎这种方法来配合解释。 -------------- **参考**: [常用异动分析方法](https://www.jianshu.com/p/1709fe2a0879) [当我们在分析异常数据时,我们在分析什么](https://cloud.tencent.com/developer/article/1163578)