​ 关注DTCC有几年了,还是在当中学到了很多的干货。今年我的大部分时间也都是投入在了数据治理的学习和数据治理工具的调研中。也非常渴望有这种机会去了解一下国内顶尖公司这方面的前沿技术与应用。

DTCC是什么?

​ DTCC数据库大会是国内顶尖的数据领域技术峰会,每年都会举办。所探讨的技术方向往往是未来几年的技术发展方向。而现在DTCC绝不只是单纯的数据库技术,其涵盖了大数据、数据治理、实时计算、数据湖、HTAP、实时数仓等诸多技术方向,这也是我一直持续关注的原因。

​ 今年的DTCC数据库大会将于2022年8月18日~20日举办,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办。今年是第13届中国数据库技术大会(DTCC2022),将在北京国际会议中心隆重召开。大会以“数据智能 价值创新”为主题,紧跟时代步伐,引领前沿技术,设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕时序数据库、图数据技术、实时数仓技术与应用实践、云原生数据库、大数据平台与数据安全等内容展开分享和探讨,为广大数据领域从业人士提供一场年度的饕餮盛宴。作为顶级的数据领域技术盛会,DTCC2022将继续秉承一贯的干货分享和最佳实践砥砺前行。

本届DTCC大会在技术主题方面,从数据库的底层内核代码开发,到数据库的架构设计,再到数据库技术的云平台实践,再到上层的AI与大数据应用,在大会的主题设置中,实现了比较全面的覆盖。

下面是我比较感兴趣的几个方向推荐给大家重点关注,并附上该演讲的具体日期。

1、数据治理

数据治理是我最感兴趣的专场,数据治理工作如何开展,数据治理工具如何选择。大数据的数据治理工作如何开展?

对存储系统来说,随着时间地推移,积累的数据越来越多,数据存储成本渐渐变得难以忽视。但当我们想要着手治理时,却发现困难重重。首先公司内的业务变动与组织架构调整是常态,保存的数据却往往无法在调整后得到妥善处理,造成存储系统内遗留大量垃圾数据甚至无主数据。其次业务开发注意力集中在业务发展上,缺乏数据成本概念,很少主动推动数据治理。最后作为存储平台方,对接全集团的存储需求,对业务数据的理解仅停留在二进制层面,造成数据治理难以推动。

这些大厂都有着丰富的经验,8月20日下午,字节跳动,安徽讯飞医疗股份有限公司和小米都会分享各自的经验,值得关注。

2、湖仓一体

数据湖的概念由来已久,但是数据仓库和数据湖各自有其适用场景。

随着大数据实时划进程得不断推进,实时与离线在开发链路与数据存储上割裂的问题逐渐暴露出来,这不仅造成了实时与离线在开发人员与存储成本上的双倍投入,还造成了实时与离线指标不统一的问题。业界新的湖仓一体架构旨在统一实时与离线的数据存储,并进一步解决实时与离线割裂的问题。

8月20日 上午8月20日 下午,阿里、美团、哔哩哔哩、网易等等公司技术专家将介绍各自的湖仓一体华实践经验。

3、HTAP

在 HTAP 数据库领域,常见的一种架构设是使用独立的行存副本和列存副本来分别处理 TP 和 AP 的业务。而这个架构带来两个挑战:1. 让列存副本支持带事务的高频更新,以实时同步 TP 业务的更新。

HTAP 能不能带来一次新的变革,现在还真的难说。

8月20日 上午可以看一下大数据平台架构方面的技术分享。

4、大数据平台与应用

大数据平台搭建了这么多年,到底有没有靠谱的解决方案。这里特别推荐一下WeDataSphere一站式开源大数据平台的建设与应用实践,这个微众银行提供的技术方案我也关注了很久。

8月20日 下午重点关注。

还有网易云分享的实时数仓建设历程:

业务的高速扩张,数据流量巨大, 超大流量的消息队列对整体带宽资源、下游的消费任务的稳定性以及计算资源都带来了巨大的挑战, 为了解决这一问题网易云音乐升级了Flink原生的实时流表的方案扩展实现了流表的分区支持, 大大降低了整体的流量带宽和计算资源的消耗;

底层技术的升级带来了大量的任务的升级改造、业务发展太快平台需要下线的废弃数据任务也会越来越多、平台开发水平层次大量的数据任务配置都需要优化升级; 等等这些都是业务平台开发日常面临的繁琐、难以推进的且很难说明价值的工作, 为了更好的触达用户, 系统化解决日常的数据任务治理工作,网易云音乐设计一套系统化、流程化、 可审计跟踪的的大数据任务治理方案来解决日常任务治理工作;

5、人工智能与大数据融合

人工智能与大数据融合是一个经久不息的话题。小红书在这个方面就有丰富的经验。

随着业务的极速扩张,小红书在模型推理和模型训练上的投入越来越大。如何借助一系列云原生技术,将现有机器学习平台演进为一个面向资源和效率平衡的平台,成为一个新的课题。本次分享主要讲述容器团队和算法工程团队合作开发的面向资效平衡的机器学习平台的演进之路。

除此以外,还有58同城、网易云音乐等公司的技术分享。

当然、本次会议的内容远不止于此,NoSQL数据库技术实践,智能运维,时序数据库 ,数据安全

SQL审计与SQL优化,图数据技术与应用创新,云原生数据库开发与实践,金融行业数据库技术实践,数据库内核技术。

StarRocks ,PolarDB,Nebula Graph v3.1.0 ,TiDB ,Presto,Apache Doris,Iceberg,Apache Pegasus等等新技术与创新都有涉足。

大会整体议程如下:

大家可以选择扫描下面的二维码进行报名参加。

也可以选择点击 阅读原文进入报名页面。

祝大家都能有所收获~

数据智能——DTCC2022!中国数据库技术大会即将开幕的更多相关文章

  1. 2017中国数据库技术大会(DTCC)又要来啦!期待~~

    2017第八届中国数据库技术大会(DTCC2017)将于2017年5月11-13日如约而至.2017中国数据库技术大会(DTCC)以"数据驱动•价值发现"为主题,汇集来自互联网.电 ...

  2. DTCC2019第十届中国数据库技术大会将于5月在北京召开

    作为国内顶级的数据领域技术盛会,10年来,DTCC见证了国内数据库技术的迅猛发展,各种分布式数据库.NoSQL.NewSQL技术异军突起,与Oracle.DB2等分庭抗礼,甚至大有超越之势.在这种背景 ...

  3. 2016 DTCC(中国数据库技术大会)

    上周去参加了2016 DTCC(数据库技术大会),会议总共持续3天,议题非常多,我这里搜集了最新的公开的PPT内容,有兴趣的同学可以下载看看,PPT合集下载链接为:http://pan.baidu.c ...

  4. 关于DTCC数据库技术大会

    本次DTCC数据库技术大会是第9届了,这次大会虽然有不少公司的产品推介,总体来说还是有不少干货的. 专场较多,有选择地主要听了大数据实践跟流式计算这块.网易跟滴滴的分享比较不错. 了解到了现在大家是用 ...

  5. 转 开启“大数据”时代--大数据挑战与NoSQL数据库技术 iteye

    一直觉得“大数据”这个名词离我很近,却又很遥远.最近不管是微博上,还是各种技术博客.论坛,碎碎念大数据概念的不胜枚举. 在我的理解里,从概念理解上来讲,大数据的目的在于更好的数据分析,否则如此大数据的 ...

  6. 阿里云POLARDB荣膺2019中国数据库年度最佳创新产品

    在日前的DTCC 2019(第十届中国数据库技术大会)上,阿里云自研云原生数据库POLARDB获选2019中国数据库——“年度最佳创新产品”. POLARDB是阿里云在2018年正式商业化的云原生数据 ...

  7. 对话对话每日互动CEO方毅:数据智能应用的过去、现在和未来每日互动CEO方毅:数据智能应用的过去、现在和未来

    2008年,大数据的概念被首次提出,麦肯锡全球研究所给出的定义是:大数据是在一种获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合. 2014年,"数据智能" ...

  8. 参加2013中国大数据技术大会(BDTC2013)

    2013年12月5日-6日参加了为期两天的2013中国大数据技术大会(Big Data Technology Conference, BDTC2013),本期会议主题是:“应用驱动的架构与技术 ”.大 ...

  9. 2016中国大数据技术大会( BDTC ) 共商大数据时代发展之计

    中国大数据技术大会(BDTC)的前身是Hadoop中国云计算大会(HadoopinChina,HiC).从2008年仅60余人参加的技术沙龙发展到当下数千人的技术盛宴,目前已成为国内最具影响力.规模最 ...

  10. 窥见云技术未来大势,腾讯云Techo开发者大会即将在京召开

    云.物联网.5G.人工智能……一项项技术的突破带来了天翻地覆的变化,开发者们是如何一次次地进行天马行空的创意和极限突破?2019年11月6日-7日,由腾讯云主办的首届Techo开发者大会将在北京嘉里大 ...

随机推荐

  1. Docker从了解到部署应用的详细教程

    一.Docker基础知识 1.Docker (1)Docker可以让开发者打包他们的应用以及依赖包到一个轻量级.可以移植的容器中,然后发布到任何的linux机器上,可以实现虚拟化: (2)Docker ...

  2. QPixmap、QIcon和QImage

    QPixmap依赖于硬件,QImage不依赖于硬件.QPixmap主要是用于绘图,针对屏幕显示而最佳化设计,QImage主要是为图像I/O.图片访问和像素修改而设计的. 当图片小的情况下,直接用QPi ...

  3. 字符串匹配算法:KMP

    Knuth–Morris–Pratt(KMP)是由三位数学家克努斯.莫里斯.普拉特同时发现,所有人们用三个人的名字来称呼这种算法,KMP是一种改进的字符串匹配算法,它的核心是利用匹配失败后的信息,尽量 ...

  4. Kubernetes: kube-apiserver 之认证

    kubernetes:kube-apiserver 系列文章: Kubernetes:kube-apiserver 之 scheme(一) Kubernetes:kube-apiserver 之 sc ...

  5. Git如何回到拉取之前的代码

    1.执行git reflog命令查看你的历史变更记录: 2.git reset --hard 2aee3f(拉代码之前的提交记录) Git基础命令总结请参考:https://blog.csdn.net ...

  6. 黑客玩具入门——5、继续Metasploit

    1.利用FTP漏洞并植入后门 实验靶机:Metasploitable2. 实践: 使用nmap扫描目标靶机 nmap -sV xxx.xxx.xxx.xxx(目标ip) 生成linux系统后门 msf ...

  7. 记一次线上Oracle连接耗时过长的问题

    问题现象 1.远程Oracle数据库通过IP:PORT/SERVICE_NAME连接 2.应用服务通过Docker容器部署,访问Oracle联通性测试接口,需要50s左右才能返回连接成功: 3.写了个 ...

  8. C和C++练习

    要点: 1.数组 2.冒泡排序BubbleSort 3.带指针的结构体(malloc,free) 4.字符串操作(拷贝.逆序.比较) 5.格式化输出printf,sprintf 6.格式化输入,sca ...

  9. Javascript Ajax总结——FormData类型

    XMLHttpRequest1级只是把已有的XHR对象的实现细节描述出来.XMLHttpRequest2级进一步发展了XHR.FormData类型FormData类型,为序列化表单以及创建以表单格式相 ...

  10. STM32CubeMX教程1 工程建立

    1.准备材料 开发板(STM32F407G-DISC1) ST-LINK/V2驱动 STM32CubeMX软件(Version 6.10.0) keil µVision5 IDE(MDK-Arm) 2 ...