A/B Testing的简要知识

A/B testing主要用来检测网站或者APP的两个版本中哪一个更好，它的中心思想是把流量一分为二，一份用作experiment group，访问新的版本，另一份用作control group，访问旧的版本。

假设现在有一个网站，要测试是否增大网页Register的字体，可以增加注册用户。

进行AB testing，首先要选择Unit of Diversion, 就是把实验分成两组的标准。在这个实验中，可以选择unique cookies to view the web page. 然后要选定Invariant metrics, 选择那些在两个版本之间不会变化，而是一致的变量。我们这个简单的例子中，可以选择网页的访问量，the unique cookies to view the web page，跟Unit of Diversion相同。然后选择Variant metrics, 要选那些可以衡量版本变化带来不同实现目标的变量，比如click-through-rate, the number of unique cookies to click register divided by the unique cookies to view the page; 比如gross conversion, the number of unique cookies to complete registration divided by the unique cookies to view the page.

选好Invariant 和Variant metrics后，就可以开始设计怎么开展实验。要选择在哪里进行，只是针对某一个国家，或者全世界；要决定实验周期，不能太久，因为用户可能渐渐适应改变，变得不再有效不再敏感，也不能太短，这样没有足够多用户接触到改变。根据情况，一般一个月就足够了。

测试过程中统计每天访问网页的cookies数目，点击了register的cookies数，以及成功完成注册的cookies. 在得到这些数据后，就是用统计学知识做假设检验。首先需要对invariant metrics做sanity check, 通过以后要进行effect size test和sign test. Sanity check的目的是要确保两组试验的网页访问量(unique cookies to view web page)差别可以忽略。

假设实验组和对照组的invariant metrics分别是X和Y。

那么标准误差standard error为:

根据置信水平significant level 95%, 查到Z值为1.96，( http://www.utdallas.edu/dept/abp/zscoretable.pdf )

那么误差区间margin of error为：

Invariant metric实际差别为：

如果误差区间m小于实际差别,通过invariant check的sanity check, 否则不可以进行下一步检测。

Effect size test实际上是假设检验，

假设X_exp和N_exp为是实验组的gross conversion和 number of cookies, X_cont和N_cont为是对照组的gross conversion和 number of cookies,那么概率

如果d的绝对值大于1.96乘以SE_pool,那么拒绝null hypothesis, 两个版本的网页是有差别的，置信水平为95%。

Sign test更进一步，检测每一天是否新版本新注册用户比旧版本多。可以用graphpad网站( http://graphpad.com/quickcalcs/binomial1.cfm )来进行测试，number of ‘success’是新版本比旧版本注册用户多的天数， Number of trials是总共天数，probability是0.5，得到的p value必须要小于alpha, 在这个例子中,等于1-95%=0.05

这几个步骤是进行AB Testing的基础，还有很多重要方面需要注意，比如

在试验前，统计每个metrics的值，得到baseline information，比如每天的cookies, CTR, Gross conversion等

计算每个invariant metrics的方差，如果invariant metrics的unit of analysis不是unit of diversion,选用经验方差empirical variance

计算sample size样本大小，结合baseline information, 来精确计算实验的周期 ( http://www.evanmiller.org/ab-testing/sample-size.html )

如果可以其中一个metric假设检验成功就可以下结论，那么会用到Bonferroni correction

A/B Testing的简要知识的更多相关文章

【linux】-Makefile简要知识+一个通用Makefile
目录 Makefile Makefile规则与示例为什么需要Makefile Makefile样式先介绍Makefile的两个函数完善Makefile 通用Makefile的使用通用的Make ...
Cordova webapp实战开发：（3）后面可能会学到的东西
在<Cordova webapp实战开发:(2)认识一下Cordova>中我们了解了Cordova和Phonegap的关系,并简要介绍了一下它的架构,以及多平台性,并给大家留了一些作业.我 ...
Scala函数式编程（三） scala集合和函数
前情提要: scala函数式编程(二) scala基础语法介绍 scala函数式编程(二) scala基础语法介绍前面已经稍微介绍了scala的常用语法以及面向对象的一些简要知识,这次是补充上一章的 ...
《自动化平台测试开发-Python测试开发实战》新书出版了
首先第一本书,当初在百度阅读初步写了个电子版,刚一上线不久即收到了数百位读者朋友阅读收藏购买,于是顺利成章就出版了纸质书. <软件自动化测试开发>认真看过的读者应该都知道,介绍的主要是自 ...
201771010128王玉兰实验一软件工程准备——<阅读《构建之法——现代软件工程》初步了解软件工程>
|||||||||||||| |:--|:--| |项目|内容| |软件工程|https://www.cnblogs.com/nwnu-daizh/| |作业要求在博客里|https://www.cn ...
进程调度函数scheduler_tick()的触发原理：周期PERIODIC定时器
参考文章: https://www.jb51.net/article/133579.htm https://blog.csdn.net/flaoter/article/details/77509553 ...
Testing - 软件测试知识梳理 - 相关词汇
测试策略描述测试工程的总体方法和目标:根据测试需求,描述在什么测试阶,依据什么测试要素和目标,进行什么种类的测试,使用什么样的测试方法和工具. 测试策略的制定主要包含如下内容: 确定测试过程要使用的 ...
Testing - 软件测试知识梳理 - 探索性测试
定义探索性测试(Exploratory Testing)是一种自由的软件测试风格,强调测试人员同时展开测试学习,测试设计,测试执行和测试结果评估等活动,以持续优化测试工作. 其特征有:即兴发挥,快速 ...
Testing - 软件测试知识汇总
软件测试知识梳理基础概念 : http://www.cnblogs.com/anliven/p/6070000.html 测试分类 : http://www.cnblogs.com/anliven/ ...

随机推荐

菜鸟Python学习笔记第一天：关于一些函数库的使用
2017年1月3日星期二大一学习一门新的计算机语言真的很难,有时候连函数拼写出错查错都能查半天,没办法,谁让我英语太渣. 关于计算机语言的学习我想还是从C语言学习开始为好,Python有很多语言的 ...
高大上的微服务可以很简单，使用node写微服务
安装 npm install m-service --save 使用编写服务处理函数 // dir1/file1.js // 使用传入的console参数输出可以自动在日志里带上request id ...
Effective java笔记（二），所有对象的通用方法
Object类的所有非final方法(equals.hashCode.toString.clone.finalize)都要遵守通用约定(general contract),否则其它依赖于这些约定的类( ...
Angular (SPA) WebPack模块化打包、按需加载解决方案完整实现
文艺小说-?2F,言情小说-?3F,武侠小说-?9F long long ago time-1-1:A 使用工具,long long A ago time-1-2:A 使用分类工具,long long ...
Activity之概览屏幕(Overview Screen)
概览屏幕概览屏幕(也称为最新动态屏幕.最近任务列表或最近使用的应用)是一个系统级别 UI,其中列出了最近访问过的 Activity 和任务. 用户可以浏览该列表并选择要恢复的任务,也可以通过滑动清除 ...
android计算每个目录剩余空间丶总空间以及SD卡剩余空间
ublic class MemorySpaceCheck { /** * 计算剩余空间 * @param path * @return */ public static String getAvail ...
Mysql - 存储过程/自定义函数
在数据库操作中, 尤其是碰到一些复杂一些的系统, 不可避免的, 会用到函数/自定义函数, 或者存储过程. 实际项目中, 自定义函数和存储过程是越少越好, 因为这个东西多了, 也是一个非常难以维护的地方 ...
a标签绝对定位，点击区域被图片遮挡（IE下）
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
一步步学习javascript基础篇（0）:开篇索引
索引: 一步步学习javascript基础篇(1):基本概念一步步学习javascript基础篇(2):作用域和作用域链一步步学习javascript基础篇(3):Object.Function等 ...
AutoMapper(二)
返回总目录首先,先创建一个控制台项目,引用AutoMapper程序集,创建三个类User,UserDto,UserMappingProfile,下面的知识点的演示都以此项目为基础,代码分别如下: n ...

A/B Testing的简要知识

A/B Testing的简要知识的更多相关文章

随机推荐

热门专题