个性化推荐系统(七)--- ABTest ab测试平台
个性化推荐系统、搜索引擎、广告系统,这些系统都需要在线上不断上线,不断优化,优化之后怎么确定是好是坏。这时就需要ABTest来确定,最近想的办法、优化的算法、优化的逻辑数据是正向的,是有意义的,是提升数据效果的。
ab需求能方便测试,提供界面快速调整流量,调整流量后能够方便看效果变化,以及不同ab分支算法对比到底是a算法好、还是b算法好、还是c算法好。再有就是白名单配置上线新算法时,实现新算法上线测试,验证程序是否正确。
根据ABtest需求,系统有三个大的系统构成。一个系统是ABTest配置管理平台用于管理每个ab需求。一个是ABTest实时分流服务,根据用户设备信息、用户信息进行ab分流。一个系统是实时效果分析统计,将分流后程序点击、浏览、gmv转化通过hive、hadoop程序统计后,在统计平台上进行展示。
ABTest配置管理平台,平台设计为每一个ab测试生成唯一id,围绕id生成测试对象,对象包含各种分组配置,每一组分组配置包含生效时间。配置管理用户白名单,白名单用户会直接分配到配置分流,而不根据算法计算分配到某个分支,白名单既能对分支算法进行测试,避免找多个用户看用户是否在需要测试算法分支,当产品、运营需要看当前新算法推出文章、商品到底是什么情况也可通过白名单方便实现。
在线实时分流服务目的是提供一个通用线上服务计算分流,返回分流结果。线上服务根据ab分流选择算法路径给用户提供个性化数据。ab服务实现需要先判断用户是否在白名单中,在白名单中直接将白名单配置分流返回。
实时分流服务算法设计为接口,接口即是协议实现接口算法皆可用以线上分流,现平台用设备尾号进行hash以保证用户流量均分,避免流量未打散、均分导致线上效果受影响。这一块还可以进行分层支持,分层ab好处是可以同时进行大量ab算法。能快速同时进行多组线上实验,快速找到好的方法提升线上效果。
实时分流服务作为基础服务,线上所有业务服务都会访问,算法正确性、服务稳定性、性能都极其重要。分流算法正确性服务先在线上试运行,一段时间后基本没有问题。稳定性、性能需要极高因为线上服务均要调用它。架构设计方式配置管理平台配置信息要缓存到本地缓存中,避免每次用户请求请求mysql数据库,每分钟几百万次请求这对数据库是灾难。当配置有变化后通过zookeeper通知变化,或定时30s去拉去配置都是很好的实现。性能要好因为线上服务均依赖它,它慢会导致线上服务慢。算法实现要简单明了,避免不必要循环以及逻辑,这点可通过review来保证。
统计分析平台,有了好用的配置管理平台,方便高性能的线上服务,统计分析作为逻辑、算法、优化是否有意义最终标准。要求是实时数据、离线数据统计能通过图表方便直观查到,并且数据要正确有一定延时可以接受、准确性是更重要的指标。
通过ABTest平台方便我们不仅仅方便做搜索引擎、推荐系统持续优化,其实线上UI、文案等各种优化,均可以通过ab来科学、直观、方便分析,到底是正向效果、没有效果、还是负向效果,讲科学避免拍脑袋。ab白名单还可以用来提供服务白名单服务,结合日志服务实现线上白名单服务,既方便定位问题,又能避免大量日志导致线上服务性能差。
微信搜索:debugme123
微信扫码或长按二维码:
个性化推荐系统(七)--- ABTest ab测试平台的更多相关文章
- 网易郑栋:数据采集与分析的那些事——从数据埋点到AB测试
本文由 网易云发布. 4月8日晚,DTalk邀请到了网易互联网分析产品.可视化 BI 产品的负责人—郑栋老师,进行了一次关于<网易郑栋:数据采集与分析的那些事第一弹: 数据篇>的主题分享 ...
- Apache 的ab测试
<!-- 博主所有文章仅是作为自己的笔记 如有不足 请见谅--> Apache的ab测试 和 ab测试 不是一个东西(百度 ab测试可以了解) 网站性能压力测试是服务器网站性能调优过程 ...
- 20145209刘一阳《JAVA程序设计》第七周课堂测试
第七周课堂测试 1.命令"CREATE DATABASE "用来创建一个数据库.(A) A .true B .false 2.以下不属于驱动的四种类型的是(C) A .JDBC-O ...
- 从零开始学AB测试:躲坑篇
AB测试的原理很简单,只用到了最简单的统计假设检验,但表面的简单通常都隐藏着陷阱,这一点没有经过实践的摸爬滚打是不容易看到的,今天我就把前人已经踩过的坑,一共15个,给大家分享一下.在分享之前,大家脑 ...
- 《SystemVerilog验证-测试平台编写指南》学习 - 第1章 验证导论
<SystemVerilog验证-测试平台编写指南>学习 - 第1章 验证导论 测试平台(testbench)的功能 方法学基础 1. 受约束的随机激励 2. 功能覆盖率 3. 分层的测试 ...
- 【转载】AB测试结果分析
AB测试,200个请求,20个并发.这样的测试强度,CPU占了70-80%,w3p占用了70多M内存,本想多测几次,看看它的内存会不会涨上去,没 有测试机器没办法,开发机要干活.我估计CPU就有问题了 ...
- 微软官方网站线上兼容测试平台-Browser screenshots
前端开发时最不想做的就是在不同浏览器.平台和分辨率测试网页显示效果,通常这会浮现许多问题,尤其浏览器版本就可能让显示成效完全不同,也只好尽力维持让每一种设备都能正常浏览网页.修改到完全没有问题必须投入 ...
- Optimizely:在线网站A/B测试平台
Optimizely:在线网站A/B测试平台是一家提供 A/B 测试服务的公司.A/B 测试能够对比不同版本的设计,选取更吸引用户眼球的那一款,从而带来更为优化的个人体验.让网站所有者易于对不同版本的 ...
- Testin云测试平台初体验
这几天偶然接触到了一个叫做Testin的云测试平台,经过一番体验,感觉还是不错的,因为里面提供了大量的测试机型,可以针对Android手机的严重碎片化现象做出比较全面的测试,同时Testin的测试内容 ...
随机推荐
- 从JS和jQuery浅谈DOM操作,当我们在获取时,究竟获取了什么
0.写在前面的话 自己对前端的东西一直不是很熟,现在开始要想办法从前端各个地方去获取想要的属性值的时候,也基本是在网上现炒现卖,几周下来,发现自己还是迷迷糊糊,可以算是一无所获. 所以就抽时间,把这一 ...
- python 实现登录程序
本文介绍一个用python 实现的登录程序.python新手们可以参考一下. 用户信息存放于一个文件中,需要引入文件,校验输入的用户名.密码是否跟用户列表中的用户名密码相匹配,如果匹配,这登录成功,否 ...
- Kafka水位(high watermark)与leader epoch的讨论
~~~这是一篇有点长的文章,希望不会令你昏昏欲睡~~~ 本文主要讨论0.11版本之前Kafka的副本备份机制的设计问题以及0.11是如何解决的.简单来说,0.11之前副本备份机制主要依赖水位(或水印) ...
- 循环语句for,while,until,select
循环 *循环执行 将某代码段重复运行多次 重复运行多少次: 循环次数事先已知 循环次数事先未知 有进入条件和退出条件 *常见的循环语句有for,while,until for循环 for 变量名 n ...
- Java多线程Runnable与Callable区别与拓展
我们先来分别看一下这两个接口 Runnable: // // Source code recreated from a .class file by IntelliJ IDEA // (powered ...
- node.js的generic-pool与mysql结合,mysql连接池
var generic_pool = require('generic-pool'); var pool = generic_pool.Pool({ name: 'mysql', ma ...
- Android 8.0 功能和 API
Android 8.0 为用户和开发者引入多种新功能.本文重点介绍面向开发者的新功能. 用户体验 通知 在 Android 8.0 中,我们已重新设计通知,以便为管理通知行为和设置提供更轻松和更统一的 ...
- bzoj3209 花神的数论题 (二进制数位dp)
二进制数位dp,就是把原本的数字转化成二进制而以,原来是10进制,现在是二进制来做,没有想像的那么难 不知到自己怎么相出来的...感觉,如果没有一个明确的思路,就算做出来了,也并不能锻炼自己的能力,因 ...
- Tomcat服务器如何读取本地磁盘数据?
实际问题: 如何让用户下载本地磁盘的资源文件呢? 在server.xml文件中配置虚拟路径如下(以下代码放在Host标签之中即可): 例如: 具体含义: 把本地磁盘目录 "D:\uploa ...
- Python实战之列表简单练习
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__ ...