​ 关注DTCC有几年了,还是在当中学到了很多的干货。今年我的大部分时间也都是投入在了数据治理的学习和数据治理工具的调研中。也非常渴望有这种机会去了解一下国内顶尖公司这方面的前沿技术与应用。

DTCC是什么?

​ DTCC数据库大会是国内顶尖的数据领域技术峰会,每年都会举办。所探讨的技术方向往往是未来几年的技术发展方向。而现在DTCC绝不只是单纯的数据库技术,其涵盖了大数据、数据治理、实时计算、数据湖、HTAP、实时数仓等诸多技术方向,这也是我一直持续关注的原因。

​ 今年的DTCC数据库大会将于2022年8月18日~20日举办,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办。今年是第13届中国数据库技术大会(DTCC2022),将在北京国际会议中心隆重召开。大会以“数据智能 价值创新”为主题,紧跟时代步伐,引领前沿技术,设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕时序数据库、图数据技术、实时数仓技术与应用实践、云原生数据库、大数据平台与数据安全等内容展开分享和探讨,为广大数据领域从业人士提供一场年度的饕餮盛宴。作为顶级的数据领域技术盛会,DTCC2022将继续秉承一贯的干货分享和最佳实践砥砺前行。

本届DTCC大会在技术主题方面,从数据库的底层内核代码开发,到数据库的架构设计,再到数据库技术的云平台实践,再到上层的AI与大数据应用,在大会的主题设置中,实现了比较全面的覆盖。

下面是我比较感兴趣的几个方向推荐给大家重点关注,并附上该演讲的具体日期。

1、数据治理

数据治理是我最感兴趣的专场,数据治理工作如何开展,数据治理工具如何选择。大数据的数据治理工作如何开展?

对存储系统来说,随着时间地推移,积累的数据越来越多,数据存储成本渐渐变得难以忽视。但当我们想要着手治理时,却发现困难重重。首先公司内的业务变动与组织架构调整是常态,保存的数据却往往无法在调整后得到妥善处理,造成存储系统内遗留大量垃圾数据甚至无主数据。其次业务开发注意力集中在业务发展上,缺乏数据成本概念,很少主动推动数据治理。最后作为存储平台方,对接全集团的存储需求,对业务数据的理解仅停留在二进制层面,造成数据治理难以推动。

这些大厂都有着丰富的经验,8月20日下午,字节跳动,安徽讯飞医疗股份有限公司和小米都会分享各自的经验,值得关注。

2、湖仓一体

数据湖的概念由来已久,但是数据仓库和数据湖各自有其适用场景。

随着大数据实时划进程得不断推进,实时与离线在开发链路与数据存储上割裂的问题逐渐暴露出来,这不仅造成了实时与离线在开发人员与存储成本上的双倍投入,还造成了实时与离线指标不统一的问题。业界新的湖仓一体架构旨在统一实时与离线的数据存储,并进一步解决实时与离线割裂的问题。

8月20日 上午8月20日 下午,阿里、美团、哔哩哔哩、网易等等公司技术专家将介绍各自的湖仓一体华实践经验。

3、HTAP

在 HTAP 数据库领域,常见的一种架构设是使用独立的行存副本和列存副本来分别处理 TP 和 AP 的业务。而这个架构带来两个挑战:1. 让列存副本支持带事务的高频更新,以实时同步 TP 业务的更新。

HTAP 能不能带来一次新的变革,现在还真的难说。

8月20日 上午可以看一下大数据平台架构方面的技术分享。

4、大数据平台与应用

大数据平台搭建了这么多年,到底有没有靠谱的解决方案。这里特别推荐一下WeDataSphere一站式开源大数据平台的建设与应用实践,这个微众银行提供的技术方案我也关注了很久。

8月20日 下午重点关注。

还有网易云分享的实时数仓建设历程:

业务的高速扩张,数据流量巨大, 超大流量的消息队列对整体带宽资源、下游的消费任务的稳定性以及计算资源都带来了巨大的挑战, 为了解决这一问题网易云音乐升级了Flink原生的实时流表的方案扩展实现了流表的分区支持, 大大降低了整体的流量带宽和计算资源的消耗;

底层技术的升级带来了大量的任务的升级改造、业务发展太快平台需要下线的废弃数据任务也会越来越多、平台开发水平层次大量的数据任务配置都需要优化升级; 等等这些都是业务平台开发日常面临的繁琐、难以推进的且很难说明价值的工作, 为了更好的触达用户, 系统化解决日常的数据任务治理工作,网易云音乐设计一套系统化、流程化、 可审计跟踪的的大数据任务治理方案来解决日常任务治理工作;

5、人工智能与大数据融合

人工智能与大数据融合是一个经久不息的话题。小红书在这个方面就有丰富的经验。

随着业务的极速扩张,小红书在模型推理和模型训练上的投入越来越大。如何借助一系列云原生技术,将现有机器学习平台演进为一个面向资源和效率平衡的平台,成为一个新的课题。本次分享主要讲述容器团队和算法工程团队合作开发的面向资效平衡的机器学习平台的演进之路。

除此以外,还有58同城、网易云音乐等公司的技术分享。

当然、本次会议的内容远不止于此,NoSQL数据库技术实践,智能运维,时序数据库 ,数据安全

SQL审计与SQL优化,图数据技术与应用创新,云原生数据库开发与实践,金融行业数据库技术实践,数据库内核技术。

StarRocks ,PolarDB,Nebula Graph v3.1.0 ,TiDB ,Presto,Apache Doris,Iceberg,Apache Pegasus等等新技术与创新都有涉足。

大会整体议程如下:

大家可以选择扫描下面的二维码进行报名参加。

也可以选择点击 阅读原文进入报名页面。

祝大家都能有所收获~

数据智能——DTCC2022!中国数据库技术大会即将开幕的更多相关文章

  1. 2017中国数据库技术大会(DTCC)又要来啦!期待~~

    2017第八届中国数据库技术大会(DTCC2017)将于2017年5月11-13日如约而至.2017中国数据库技术大会(DTCC)以"数据驱动•价值发现"为主题,汇集来自互联网.电 ...

  2. DTCC2019第十届中国数据库技术大会将于5月在北京召开

    作为国内顶级的数据领域技术盛会,10年来,DTCC见证了国内数据库技术的迅猛发展,各种分布式数据库.NoSQL.NewSQL技术异军突起,与Oracle.DB2等分庭抗礼,甚至大有超越之势.在这种背景 ...

  3. 2016 DTCC(中国数据库技术大会)

    上周去参加了2016 DTCC(数据库技术大会),会议总共持续3天,议题非常多,我这里搜集了最新的公开的PPT内容,有兴趣的同学可以下载看看,PPT合集下载链接为:http://pan.baidu.c ...

  4. 关于DTCC数据库技术大会

    本次DTCC数据库技术大会是第9届了,这次大会虽然有不少公司的产品推介,总体来说还是有不少干货的. 专场较多,有选择地主要听了大数据实践跟流式计算这块.网易跟滴滴的分享比较不错. 了解到了现在大家是用 ...

  5. 转 开启“大数据”时代--大数据挑战与NoSQL数据库技术 iteye

    一直觉得“大数据”这个名词离我很近,却又很遥远.最近不管是微博上,还是各种技术博客.论坛,碎碎念大数据概念的不胜枚举. 在我的理解里,从概念理解上来讲,大数据的目的在于更好的数据分析,否则如此大数据的 ...

  6. 阿里云POLARDB荣膺2019中国数据库年度最佳创新产品

    在日前的DTCC 2019(第十届中国数据库技术大会)上,阿里云自研云原生数据库POLARDB获选2019中国数据库——“年度最佳创新产品”. POLARDB是阿里云在2018年正式商业化的云原生数据 ...

  7. 对话对话每日互动CEO方毅:数据智能应用的过去、现在和未来每日互动CEO方毅:数据智能应用的过去、现在和未来

    2008年,大数据的概念被首次提出,麦肯锡全球研究所给出的定义是:大数据是在一种获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合. 2014年,"数据智能" ...

  8. 参加2013中国大数据技术大会(BDTC2013)

    2013年12月5日-6日参加了为期两天的2013中国大数据技术大会(Big Data Technology Conference, BDTC2013),本期会议主题是:“应用驱动的架构与技术 ”.大 ...

  9. 2016中国大数据技术大会( BDTC ) 共商大数据时代发展之计

    中国大数据技术大会(BDTC)的前身是Hadoop中国云计算大会(HadoopinChina,HiC).从2008年仅60余人参加的技术沙龙发展到当下数千人的技术盛宴,目前已成为国内最具影响力.规模最 ...

  10. 窥见云技术未来大势,腾讯云Techo开发者大会即将在京召开

    云.物联网.5G.人工智能……一项项技术的突破带来了天翻地覆的变化,开发者们是如何一次次地进行天马行空的创意和极限突破?2019年11月6日-7日,由腾讯云主办的首届Techo开发者大会将在北京嘉里大 ...

随机推荐

  1. 资源迁移OSS方案记录

    视频资源迁移到OSS服务器上,记录一下迁移过程. 搭建流程 在阿里云上购买oss,并获取具有该Bucket访问权限的AccessKey ID和AccessKey Secret信息. 数据迁移方案一 第 ...

  2. 多巴胺所表达的prediction error信号

    Dopamine reward prediction-error signalling: a two-component response (Wolfram Schultz; NATURE REVIE ...

  3. (int argc, char *argv[])在MCU中的调试使用

    这里主要讲了基于RTT的 finsh->MSH_CMD_EXPORT 方法,在串口终端中调用自定义函数,并传入参数的方法. 在传统的MCU开发中 当我们需要测试一个函数在传入不同参数时的运算结果 ...

  4. .NET6中的await原理浅析

    前言 看过不少关于 await 的原理的文章,也知道背后是编译器给转成了状态机实现的,但是具体是怎么完成的,回调又是如何衔接的,一直都没有搞清楚,这次下定决心把源码自己跑了下,终于豁然开朗了 本文的演 ...

  5. Vue源码学习(十八):实现组件注册(一)Vue.component()和Vue.extend()

    好家伙, 0.完整代码已开源 https://github.com/Fattiger4399/analytic-vue.git 1.思路 1.1.什么是组件化? Vue 组件化是指将复杂的应用程序拆分 ...

  6. nacos 安装和使用

    Nacos 是阿里巴巴开源项目,用于构建微服务应用的服务发现.配置管理和服务管理. 在微服务项目中不同模块之间服务调用时,实现服务注册与发现. Nacos 使用: Nacos 是java开发的,依赖 ...

  7. [ARC137E] Baker

    Problem Statement Snuke runs a bakery. He is planning for the next $N$ days. Let us call these days ...

  8. AI浪潮下,大模型如何在音视频领域运用与实践?

    视频云大模型算法「方法论」. 刘国栋|演讲者 在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开.音视频技术在多场景.多行业的应用中,对于智能化和效果性能的体验优化有较为极 ...

  9. MybatisPlus高级特性之SimpleQuery工具类

    1.是很么? SimpleQuery可以对selectList查询后的结果使用Stream流进行操作,使其可以返回指定的结果,简洁了api的调用 2.怎么玩? 案例演示 (1) list操作 /** ...

  10. 8、switch语句

    1.switch语句:"开关" switch是一个条件语句,它计算表达式并将其与可能匹配的列表进行比较,并根据匹配执行代码块.它可以被认为是一种惯用的方式来写多个if else子句 ...