更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
 
近日,火山引擎数智平台VeDI直播活动「超话数据」在线举办,来自火山引擎的产品及解决方案专家分享了以ByteHouse为代表的云数仓产品在字节跳动的演进过程、关键技术以及最佳实践,并通过五个步骤拆解,带领开发者快速上手云数仓。
 
现如今,企业正加速走向数字化、智能化,对数据的应用也提出了全新要求,特别是在数据实时分析、实时部署方面的诉求更加强烈,而云数据仓库为用户实现云原生、智能运维、弹性资源等业务需求带来了很好支撑,成为今天企业数字化基础设施中的关键“底座”。
 
ByteHouse则是这样一款云原生数据仓库。ByteHouse起初是基于开源ClickHouse引擎进行技术架构重构和优化,在字节跳动内部大规模应用,其中部署规模超过1万8000台,单集群超过2400 台,现已通过火山引擎对外输出。
 
火山引擎ByteHouse
 
据ByteHouse产品专家介绍,面对企业级数据处理需求,相比起原生的ClickHouse,火山引擎ByteHouse基于独家自研的高可用引擎及查询优化器,可以为企业提供快速、稳定、安全的查询服务和数据写入性能。在云原生架构下,火山引擎ByteHouse提供了极致扩展的统一数据分析平台,具有出色的弹性伸缩和可扩展性,确保资源可以灵活地水平扩展;同时,ByteHouse支持多级资源隔离,为用户资源提供更安心的安全保障。
 
除了高可用的基础能力,火山引擎ByteHouse还从业务角度出发提供了完整的运维监控和排障能力,帮助企业实现业务云上托管,降低运维成本。
 
不仅仅具备强大的技术能力和易用的产品特性,火山引擎ByteHouse在广告、气象、行为分析等领域已经积累丰富的落地经验。在此次活动中,火山引擎解决方案专家通过广告、气象、行为分析3个领域案例,详细拆解云原生数据仓库如何能在业务场景中丝滑落地。
 
首先,在广告受众预估领域,为了帮助广告主确定目标人群,判断投放价值,广告平台需要为广告主提供受众筛选能力,即根据不同筛选条件、标签或人群包,确定每次营销活动覆盖的人员类型、人员规模。其难度在于,广告平台用户体量大、人群包数量大,导致单个查询中涉及多个人群包计算,使得查询复杂度高;另外,广告平台对数据实效性要求高,数据查询效率要达到秒级响应。
 
面对此类需求,ByteHouse支持BitMap数据格式,降低人群包数据内存占用,配合uid的数据分片方式,提升数据查询并发能力,实现高效的人群包交、并、补计算,满足QPS峰值查询需求,最终达到查询秒级响应的效果。
 
火山引擎ByteHouse在广告受众预估领域落地
 
其次,在气象领域,ByteHouse帮助AI大模型与数字孪生公司大地量子实现对气象数据的精准预测。根据风向、湿度、温度、风力等历史气象数据,结合风场、云层等模型能力预测未来能源情况,是大地量子的主要应用场景。大地量子通过将现场采集及大模型生成的气象数据导入到ByteHouse中,由ByteHouse支撑GEO查询和空间计算能力,满足其对预测系统以及交互式查询需求。目前,大地量子的平均查询响应时长不仅在50毫秒以内,预测精准度也得到有效提升。
 
最后,在行为分析领域,极客邦科技则通过ByteHouse实现以用户为中心的精细化营销。作为致力于为数字人才提供全方位、高质量新闻资讯、课程内容、大会、指导等服务项目的企业,极客邦科技会根据用户画像、在端内的操作行为等数据为用户精准推送课程、活动,洞察用户全链路行为,以便提供更好服务。但随着用户数量变大且持续增长,数据查询需求愈加复杂,同时也面临快速响应的问题,在技术层面遇到很多挑战。
 
增长分析平台DataFinder与云原生数据仓库数据仓库ByteHouse的组合使用则帮助极客邦科技更好洞悉客户全链路营销旅途。ByteHouse的高可用引擎和查询优化器可以将用户表、事件表等数据高效去重、分析和计算,再通过DataFinder SDK实现事件分析、留存分析、转化分析等能力,实现用户精准洞察和营销能力升级。
 
不仅仅在广告、气象等领域落地,ByteHouse 还将持续通过创新的技术和功能,帮助更多行业构建高效、稳定和可扩展的实时数据分析平台,提供强大的数据处理和分析能力,助力企业更好实现数字化升级。
 

点击跳转火山引擎ByteHouse了解更多

多领域应用落地,火山引擎ByteHouse加速云数仓升级的更多相关文章

  1. ByteHouse云数仓版查询性能优化和MySQL生态完善

    ByteHouse云数仓版是字节跳动数据平台团队在复用开源 ClickHouse runtime 的基础上,基于云原生架构重构设计,并新增和优化了大量功能.在字节内部,ByteHouse被广泛用于各类 ...

  2. 高性能、快响应!火山引擎 ByteHouse 物化视图功能及入门介绍

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 物化视图是指将视图的计算结果存储在数据库中的一种技术.当用户执行查询时,数据库会直接从已经预计算好的结果中获取数据 ...

  3. JuiceFS 在火山引擎边缘计算的应用实践

    火山引擎边缘云是以云计算基础技术和边缘异构算力结合网络为基础,构建在边缘大规模基础设施之上的云计算服务,形成以边缘位置的计算.网络.存储.安全.智能为核心能力的新一代分布式云计算解决方案. 01- 边 ...

  4. 火山引擎 DataLeap 的 Data Catalog 系统公有云实践

      Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据.数据消费者找数和理解数的业务场景.本篇内容源自于火山引擎大数据研发治理套件 DataLeap 中的 Data Ca ...

  5. 火山引擎 DataLeap:一家企业,数据体系要怎么搭建?

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 导读:经过十多年的发展,数据治理在传统行业以及新兴互联网公司都已经产生落地实践.字节跳动也在探索一种分布式的数据治 ...

  6. 火山引擎 DataTester:让企业“无代码”也能用起来的 A/B 实验平台

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 当数字化变革方兴未艾,无代码正受到前所未有的关注.Salesforce 的数据显示,52%的 IT 部门表示,公司 ...

  7. 互联网研发效能之去哪儿网(Qunar)核心领域DevOps落地实践

    本文从业务目标角度出发,确定了开源+自建模式搭建 Qunar 研发工具链整体生态:通过 APPCODE 打通工具链,流程规范化自动化:多种手段+发布门禁助力质量提升:建立应用画像确定运维最小单元,可发 ...

  8. 还原火山引擎 A/B 测试产品——DataTester 私有化部署实践经验

      作为一款面向ToB市场的产品--火山引擎A/B测试(DataTester)为了满足客户对数据安全.合规问题等需求,探索私有化部署是产品无法绕开的一条路.   在面向ToB客户私有化的实际落地中,火 ...

  9. 火山引擎DataLeap数据调度实例的 DAG 优化方案

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 实例 DAG 介绍 DataLeap 是火山引擎自研的一站式大数据中台解决方案,集数据集成.开发.运维.治理.资产管理能力 ...

  10. 火山引擎 DataLeap:3 个关键步骤,复制字节跳动一站式数据治理经验

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维.治理. ...

随机推荐

  1. MySQL索引、事务与存储引擎

    MySQL索引.事务与存储引擎 索引介绍 1.索引的概念 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址). 使用 ...

  2. OpenJDK里的AsmTools简介

    前言 转自:http://hengyunabc.github.io/openjdk-asmtools/ https://wiki.openjdk.java.net/display/CodeTools/ ...

  3. c#利用反射获取枚举的信息

    1.将不同的枚举类型作为形参传入某函数内时,形参为Enum,在函数体内进行类型强转. private T GetEnumType<T>(object o) { T enumVal = (T ...

  4. 3.1 IDA Pro编写IDC脚本入门

    IDA Pro内置的IDC脚本语言是一种灵活的.C语言风格的脚本语言,旨在帮助逆向工程师更轻松地进行反汇编和静态分析.IDC脚本语言支持变量.表达式.循环.分支.函数等C语言中的常见语法结构,并且还提 ...

  5. vue 中如何使用axios调用接口

    首先后端采用的是restful形式,分为了 1.post(添加)请求, 2.delect(删除)请求, 3.put(修改)请求, 4.get(查询)请求, 在vue里项目里,npm i axios - ...

  6. AtCoder Beginner Contest 329 (ABC329)

    A. Spread 不说了,代码. B. Next 不说了,代码. C. Count xxx Description 给定一个长度为 \(N\) 的字符串 \(S\),求 \(S\) 中非空连续,并且 ...

  7. SpringBoot接口开发

    依赖的jar包<dependency> <groupId>org.springframework.boot</groupId> <artifactId> ...

  8. 每天5分钟复习OpenStack(十二)Ceph FileStore 和 BlueSotre

    一个最小化的Ceph集群需要三个组件MON MGR OSD.上一章我们部署了MON,本章节我们完成剩下MGR 和OSD 的部署.在文末我们将重点介绍下什么是FileStore和BlueStore,并详 ...

  9. 利用Jdk动态代理模拟MyBatis的Mapper功能

    本文将先介绍jdk动态代理的基本用法,并对其原理和注意事项予以说明.之后将以两个最常见的应用场景为例,进行代码实操.这两个应用场景分别是拦截器和声明性接口,它们在许多开发框架中广泛使用.比如在spri ...

  10. springboot实现反向代理,动态代理目标地址

    网上找了很多文章,各种照搬,只能自己实现 基于开源项目HTTP-Proxy-Servlet实现 开源项目地址:https://github.com/mitre/HTTP-Proxy-Servlet 1 ...