更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
近日,DataFun联合行行AI举办第四届“数据智能创新与实践人工智能大会,火山引擎DataTester数据科学家就“传统视角下的AB实验与互联网实验平台演进”这一话题作了分享。从宏观的层面介绍了AB实验目前在互联网的发展状态,分析预测了AB实验未来的演进趋势。
互联网AB实验期望解决的问题是:通过结果数据度量业务方案的收益并决策,接受有切实收益的业务方案,同时否决无收益甚至是负向的业务方案。但由于AB实验的结果合理性保障是在假设随机以及满足SUTVA假设两个点的基础上存在的,因此可以说当前互联网AB试验亟待解决的问题,绝大部分都与二者有关。
目前互联网AB实验平台的建设,都围绕实现分流能力、数据追踪与计算能力、统计分析与结果可视化能力以及标准实验流程4块核心能力展开。大多数互联网公司都有自建的实验平台,但成熟度参差不齐。其中,字节火山引擎DataTester完善度相对较高。在C端场景下,火山引擎DataTester SUTVA假设满足较好,实验能力发展相对成熟,有一定的标准。可以满足80%以上的C端实验需求,且需要额外投入的人力相对较少。
但在社交、直播等违背SUTVA假设的场景下,互联网大厂虽有尝试,但都未建成标准化能力。现阶段,在面对上述违背SUTVA假设的场景时,进行AB实验需要投入大量人力。“如何实现随机化”和“配套通用统计分析方法”成为实验平台发展亟待解决的两个痛点。与此同时,现阶段实验平台在易用性方面也有不足。降低使用成本和提升效率是实验平台在新业务接入、用户接入、数据接入以及指标分析四个阶段进行优化的目标。
DoE是Design of experiment 的缩写,旨在描述和解释在假设反应变化的条件下信息变化的任何任务的设计。DoE可以分为单因素实验和多因素实验,但都需要遵守DoE的4大基本原则:对照原则、随机化原则、重复性原则以及均衡性原则。而DoE的4大基本原则可以分别对应到互联网实验的“对照组”“流量分层 hash”“多天观测、扩流”以及“SRM问题”。
因此在DoE的启示下,可以分析出AB实验平台可能的六个演进方向:
  1. C端场景实验深度发展
  2. 增加正交分层:完善实验平台正交性
  3. 健全实验分析能力:
    1. 归因与解读才是王道
    2. 发展正态分布外分析能力
  4. 实验工程成本优化:
    1. 采用正交设计框架
    2. 建设标准数据源
  5. 拓展实验能力边界
  6. 完善非标场景推进准因果实验方法
 
分享的最后,也展示了AB实验领域从业者需要的专业素养。一方面平台建设者需要有过硬的编程功底、由点及面的额通用化思维、产品化和用户思维;同时业务从业者需要有扎实的统计基础。
此次的分享虽短,但详细介绍了实验平台目前的发展现状和未来的演进方向,活动参与者得以更加深入了解AB实验平台的行业现状和未来趋势,对将来火山引擎DataTester的未来发展会有更加深入的了解和更多的期待。
火山引擎DataTester源自字节跳动长期沉淀,截至2023年6月,字节已通过DataTester累计做过240万余次AB实验,日新增实验 4000余个,同时运行实验5万余个。DataTester目前服务了包括美的、得到、凯叔讲故事等在内的上百家企业,为业务的用户增长、转化、产品迭代、运营活动等各个环节提供科学的决策依据,将成熟的“数据驱动增长”经验赋能给各行业。
 
点击跳转火山引擎A/B测试了解更多

火山引擎DataTester:AB实验平台未来演进趋势是怎样的?的更多相关文章

  1. 火山引擎 DataTester:让企业“无代码”也能用起来的 A/B 实验平台

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 当数字化变革方兴未艾,无代码正受到前所未有的关注.Salesforce 的数据显示,52%的 IT 部门表示,公司 ...

  2. 还原火山引擎 A/B 测试产品——DataTester 私有化部署实践经验

      作为一款面向ToB市场的产品--火山引擎A/B测试(DataTester)为了满足客户对数据安全.合规问题等需求,探索私有化部署是产品无法绕开的一条路.   在面向ToB客户私有化的实际落地中,火 ...

  3. 滴滴数据驱动利器:AB实验之分组提效

    桔妹导读:在各大互联网公司都提倡数据驱动的今天,AB实验是我们进行决策分析的一个重要利器.一次实验过程会包含多个环节,今天主要给大家分享滴滴实验平台在分组环节推出的一种提升分组均匀性的新方法.本文首先 ...

  4. 火山引擎 DataLeap:揭秘字节跳动数据血缘架构演进之路

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维 ...

  5. 火山引擎 A/B 测试产品——DataTester 私有化架构分享

    作为一款面向 ToB 市场的产品--火山引擎A/B测试(DataTester)为了满足客户对数据安全.合规问题等需求,探索私有化部署是产品无法绕开的一条路. 在面向 ToB 客户私有化的实际落地中,火 ...

  6. 为什么在数据驱动的路上,AB 实验值得信赖?

    在线AB实验成为当今互联网公司中必不可少的数据驱动的工具,很多公司把自己的应用来做一次AB实验作为数据驱动的试金石. 文 | 松宝 来自 字节跳动数据平台团队增长平台 在线AB实验成为当今互联网公司中 ...

  7. 火山引擎 DataLeap 的 Data Catalog 系统公有云实践

      Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据.数据消费者找数和理解数的业务场景.本篇内容源自于火山引擎大数据研发治理套件 DataLeap 中的 Data Ca ...

  8. 如何又快又好实现 Catalog 系统搜索能力?火山引擎 DataLeap 这样做

      摘要 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维.治理.资产.安全等全套数据中台建设,降低工作成本和数据维护成本.挖掘数据价 ...

  9. 火山引擎 DataLeap:3 个关键步骤,复制字节跳动一站式数据治理经验

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维.治理. ...

  10. 火山引擎 DataLeap:一家企业,数据体系要怎么搭建?

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 导读:经过十多年的发展,数据治理在传统行业以及新兴互联网公司都已经产生落地实践.字节跳动也在探索一种分布式的数据治 ...

随机推荐

  1. 图片调整大小,图片改变像素,用win10自带的工具就够了

    A:大哥大哥,你会PS吗? 内心:好家伙,什么大项目,都用上ps了,还好大学的时候学过一点点. 我:嗯嗯,会一点,怎么了 A:你看,帮我调整一下图片呗 内心:哈哈,又能看到某人的照片了.... 我:害 ...

  2. 【爬虫】一次爬取某瓣top电影前250的学习记录

    先贴上爬取的脚本: import requests import re for i in range(1,11):     num=(i-1)*25     url=f"https://mo ...

  3. 马云说的AI电商时代是什么

    这两天非常火的就是马老师说的,我们已经进入了AI的电商时代.相信电商时代大家很容易理解,换一个简单的方式来说就是网上购物. AI相信大家已经很熟悉了,就是人工智能.早在十年前其实已经有AI人工智能的概 ...

  4. java监听全局组合键

    1. jintellitype pom <!-- 不能注册多个组合键比如alt+abc --> <!-- https://mvnrepository.com/artifact/com ...

  5. C# 字节数组、各进制字符串数据互转

    前言 日常开发过程中,格式转换是必不可少的重要环节,经常是十进制转十六进制.十六进制转byte数组又转换回来来回转换,最然进制转换很基础同时 C# 也提供了很多直接方便进行格式转换的方法,但是封装一个 ...

  6. Mybatis出现Caused by: net.sf.jsqlparser.parser.ParseException: ....异常

    今天在开发项目中遇到了一个奇怪的异常,记录一下把! 异常信息如下(截取了主要的部分) Caused by: net.sf.jsqlparser.parser.ParseException: Encou ...

  7. 蓝桥杯-最短路 (SPFA算法学习)

    SPFA算法主要用来解决存在负边权的单源最短路情况(但不能有负环!!!)一个简单的方法判断是否有没有负环可以通过判断是否有一个节点是否频繁进出队列. 以下内容转自https://blog.csdn.n ...

  8. 关于Secure Hash Algorithm加密算法

    一.概述 SHA(Secure Hash Algorithm)加密算法是一种广泛应用的密码散列函数,由美国国家安全局(NSA)设计,用于保障数据的安全性和完整性.SHA算法经历了多个版本的更新,目前主 ...

  9. NetSuite 开发日记:批量增删改

    一.批量插入/创建 使用 record.create() 插入数据时,一次只能插入一条,有多条数据需要插入时只能通过循环的方式,这样效率非常慢,耗时会随着数据量的增大而呈线性增长,有一种巧妙的方式可以 ...

  10. 已解决:若依更换日志EasyExcel框架导出报错 java.lang.NoClassDefFoundError: org/apache/poi/POIXMLTypeLoader

    先描述一下当时的场景 回忆 看到出错了,我就想可能是哪个路径写错了,或者导依赖名字写对,或者说是多了少了标点符号什么的. 然而,还是想简单了,检查重启后发现问题并没有解决. 于是就把所有我改过的地方检 ...