​ 关注DTCC有几年了,还是在当中学到了很多的干货。今年我的大部分时间也都是投入在了数据治理的学习和数据治理工具的调研中。也非常渴望有这种机会去了解一下国内顶尖公司这方面的前沿技术与应用。

DTCC是什么?

​ DTCC数据库大会是国内顶尖的数据领域技术峰会,每年都会举办。所探讨的技术方向往往是未来几年的技术发展方向。而现在DTCC绝不只是单纯的数据库技术,其涵盖了大数据、数据治理、实时计算、数据湖、HTAP、实时数仓等诸多技术方向,这也是我一直持续关注的原因。

​ 今年的DTCC数据库大会将于2022年8月18日~20日举办,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办。今年是第13届中国数据库技术大会(DTCC2022),将在北京国际会议中心隆重召开。大会以“数据智能 价值创新”为主题,紧跟时代步伐,引领前沿技术,设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕时序数据库、图数据技术、实时数仓技术与应用实践、云原生数据库、大数据平台与数据安全等内容展开分享和探讨,为广大数据领域从业人士提供一场年度的饕餮盛宴。作为顶级的数据领域技术盛会,DTCC2022将继续秉承一贯的干货分享和最佳实践砥砺前行。

本届DTCC大会在技术主题方面,从数据库的底层内核代码开发,到数据库的架构设计,再到数据库技术的云平台实践,再到上层的AI与大数据应用,在大会的主题设置中,实现了比较全面的覆盖。

下面是我比较感兴趣的几个方向推荐给大家重点关注,并附上该演讲的具体日期。

1、数据治理

数据治理是我最感兴趣的专场,数据治理工作如何开展,数据治理工具如何选择。大数据的数据治理工作如何开展?

对存储系统来说,随着时间地推移,积累的数据越来越多,数据存储成本渐渐变得难以忽视。但当我们想要着手治理时,却发现困难重重。首先公司内的业务变动与组织架构调整是常态,保存的数据却往往无法在调整后得到妥善处理,造成存储系统内遗留大量垃圾数据甚至无主数据。其次业务开发注意力集中在业务发展上,缺乏数据成本概念,很少主动推动数据治理。最后作为存储平台方,对接全集团的存储需求,对业务数据的理解仅停留在二进制层面,造成数据治理难以推动。

这些大厂都有着丰富的经验,8月20日下午,字节跳动,安徽讯飞医疗股份有限公司和小米都会分享各自的经验,值得关注。

2、湖仓一体

数据湖的概念由来已久,但是数据仓库和数据湖各自有其适用场景。

随着大数据实时划进程得不断推进,实时与离线在开发链路与数据存储上割裂的问题逐渐暴露出来,这不仅造成了实时与离线在开发人员与存储成本上的双倍投入,还造成了实时与离线指标不统一的问题。业界新的湖仓一体架构旨在统一实时与离线的数据存储,并进一步解决实时与离线割裂的问题。

8月20日 上午8月20日 下午,阿里、美团、哔哩哔哩、网易等等公司技术专家将介绍各自的湖仓一体华实践经验。

3、HTAP

在 HTAP 数据库领域,常见的一种架构设是使用独立的行存副本和列存副本来分别处理 TP 和 AP 的业务。而这个架构带来两个挑战:1. 让列存副本支持带事务的高频更新,以实时同步 TP 业务的更新。

HTAP 能不能带来一次新的变革,现在还真的难说。

8月20日 上午可以看一下大数据平台架构方面的技术分享。

4、大数据平台与应用

大数据平台搭建了这么多年,到底有没有靠谱的解决方案。这里特别推荐一下WeDataSphere一站式开源大数据平台的建设与应用实践,这个微众银行提供的技术方案我也关注了很久。

8月20日 下午重点关注。

还有网易云分享的实时数仓建设历程:

业务的高速扩张,数据流量巨大, 超大流量的消息队列对整体带宽资源、下游的消费任务的稳定性以及计算资源都带来了巨大的挑战, 为了解决这一问题网易云音乐升级了Flink原生的实时流表的方案扩展实现了流表的分区支持, 大大降低了整体的流量带宽和计算资源的消耗;

底层技术的升级带来了大量的任务的升级改造、业务发展太快平台需要下线的废弃数据任务也会越来越多、平台开发水平层次大量的数据任务配置都需要优化升级; 等等这些都是业务平台开发日常面临的繁琐、难以推进的且很难说明价值的工作, 为了更好的触达用户, 系统化解决日常的数据任务治理工作,网易云音乐设计一套系统化、流程化、 可审计跟踪的的大数据任务治理方案来解决日常任务治理工作;

5、人工智能与大数据融合

人工智能与大数据融合是一个经久不息的话题。小红书在这个方面就有丰富的经验。

随着业务的极速扩张,小红书在模型推理和模型训练上的投入越来越大。如何借助一系列云原生技术,将现有机器学习平台演进为一个面向资源和效率平衡的平台,成为一个新的课题。本次分享主要讲述容器团队和算法工程团队合作开发的面向资效平衡的机器学习平台的演进之路。

除此以外,还有58同城、网易云音乐等公司的技术分享。

当然、本次会议的内容远不止于此,NoSQL数据库技术实践,智能运维,时序数据库 ,数据安全

SQL审计与SQL优化,图数据技术与应用创新,云原生数据库开发与实践,金融行业数据库技术实践,数据库内核技术。

StarRocks ,PolarDB,Nebula Graph v3.1.0 ,TiDB ,Presto,Apache Doris,Iceberg,Apache Pegasus等等新技术与创新都有涉足。

大会整体议程如下:

大家可以选择扫描下面的二维码进行报名参加。

也可以选择点击 阅读原文进入报名页面。

祝大家都能有所收获~

数据智能——DTCC2022!中国数据库技术大会即将开幕的更多相关文章

  1. 2017中国数据库技术大会(DTCC)又要来啦!期待~~

    2017第八届中国数据库技术大会(DTCC2017)将于2017年5月11-13日如约而至.2017中国数据库技术大会(DTCC)以"数据驱动•价值发现"为主题,汇集来自互联网.电 ...

  2. DTCC2019第十届中国数据库技术大会将于5月在北京召开

    作为国内顶级的数据领域技术盛会,10年来,DTCC见证了国内数据库技术的迅猛发展,各种分布式数据库.NoSQL.NewSQL技术异军突起,与Oracle.DB2等分庭抗礼,甚至大有超越之势.在这种背景 ...

  3. 2016 DTCC(中国数据库技术大会)

    上周去参加了2016 DTCC(数据库技术大会),会议总共持续3天,议题非常多,我这里搜集了最新的公开的PPT内容,有兴趣的同学可以下载看看,PPT合集下载链接为:http://pan.baidu.c ...

  4. 关于DTCC数据库技术大会

    本次DTCC数据库技术大会是第9届了,这次大会虽然有不少公司的产品推介,总体来说还是有不少干货的. 专场较多,有选择地主要听了大数据实践跟流式计算这块.网易跟滴滴的分享比较不错. 了解到了现在大家是用 ...

  5. 转 开启“大数据”时代--大数据挑战与NoSQL数据库技术 iteye

    一直觉得“大数据”这个名词离我很近,却又很遥远.最近不管是微博上,还是各种技术博客.论坛,碎碎念大数据概念的不胜枚举. 在我的理解里,从概念理解上来讲,大数据的目的在于更好的数据分析,否则如此大数据的 ...

  6. 阿里云POLARDB荣膺2019中国数据库年度最佳创新产品

    在日前的DTCC 2019(第十届中国数据库技术大会)上,阿里云自研云原生数据库POLARDB获选2019中国数据库——“年度最佳创新产品”. POLARDB是阿里云在2018年正式商业化的云原生数据 ...

  7. 对话对话每日互动CEO方毅:数据智能应用的过去、现在和未来每日互动CEO方毅:数据智能应用的过去、现在和未来

    2008年,大数据的概念被首次提出,麦肯锡全球研究所给出的定义是:大数据是在一种获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合. 2014年,"数据智能" ...

  8. 参加2013中国大数据技术大会(BDTC2013)

    2013年12月5日-6日参加了为期两天的2013中国大数据技术大会(Big Data Technology Conference, BDTC2013),本期会议主题是:“应用驱动的架构与技术 ”.大 ...

  9. 2016中国大数据技术大会( BDTC ) 共商大数据时代发展之计

    中国大数据技术大会(BDTC)的前身是Hadoop中国云计算大会(HadoopinChina,HiC).从2008年仅60余人参加的技术沙龙发展到当下数千人的技术盛宴,目前已成为国内最具影响力.规模最 ...

  10. 窥见云技术未来大势,腾讯云Techo开发者大会即将在京召开

    云.物联网.5G.人工智能……一项项技术的突破带来了天翻地覆的变化,开发者们是如何一次次地进行天马行空的创意和极限突破?2019年11月6日-7日,由腾讯云主办的首届Techo开发者大会将在北京嘉里大 ...

随机推荐

  1. 【Qt6】列表模型——几个便捷的列表类型

    前面一些文章,老周简单介绍了在Qt 中使用列表模型的方法.很明显,使用 Item Model 在许多时候还是挺麻烦的--要先建模型,再放数据,最后才构建视图.为了简化这些骚操作,Qt 提供了几个便捷类 ...

  2. 词!自然语言处理之词全解和Python实战!

    本文全面探讨了词在自然语言处理(NLP)中的多维角色.从词的基础概念.形态和词性,到词语处理技术如规范化.切分和词性还原,文章深入解析了每一个环节的技术细节和应用背景.特别关注了词在多语言环境和具体N ...

  3. Boruvka 算法

    Boruvka算法解决某些问题超级好用. 这些问题形如,给你n个点,每个点有点权,任意两个点之间有边权,边权为两个点权用过某种计算方式得出. 求最小生成树. 通常用 \(O(log n)\) 的时间可 ...

  4. GPTs 初体验 - 1 分钟就能创建一个自己的 ChatGPT?

    就在 11.10 号早上,ChatGPT 已经偷摸的把GPTs功能,开放给所有尊贵的 Plus 用户了. 随着这波的功能开放,界面也是改了不少.点击左侧的 Explore 或者左下角的用户处,就可以直 ...

  5. 跨境 ERP 积加系统与金蝶云星空系统数据集成对接方案

    方案简介 由于积加ERP 系统专注服务于亚马逊跨境电商是非常复杂和庞大的应用系统,具有非常丰富的业务流程.复杂的系统架构和服务接口.主要涉及系统解决店铺运营,店铺管理,供应链管理,协同智能补货.采用& ...

  6. 神经网络入门篇:详解核对矩阵的维数(Getting your matrix dimensions right)

    核对矩阵的维数 当实现深度神经网络的时候,其中一个常用的检查代码是否有错的方法就是拿出一张纸过一遍算法中矩阵的维数. \(w\)的维度是(下一层的维数,前一层的维数),即\({{w}^{[l]}}\) ...

  7. uni-app全局样式和局部样式

    前言 好,经过上个章节的介绍完毕之后,了解了一下 UniApp 的一个全局 页面配置文件,也就是我们的一个 pages.json 文件. 那么了解完了这个文件之后,这片文章,再了解一下 UniApp ...

  8. .NET8顶级调试lldb观察FOH堆字符串分配

    前言 好久没有动用LLDB了,这种未来的下一代高性能调试器应该是用在Linux内核系统的Arm64/Riscv64/X64系统指令集上的,LLDB Debug .NET有点杀鸡用牛刀.本篇通过它来看下 ...

  9. 如何用java的虚拟线程连接数据库

    我觉得这个很简单 首先确保你idea支持jdk21. 然后把idea编译成的目标字节码设置为21版本的 然后编写代码. 创建虚拟线程的方式有: Runnable runnable = () -> ...

  10. [scrapy]一个简单的scrapy爬虫demo

    一个简单的scrapy爬虫demo 爬取豆瓣top250的电影名称+电影口号 使用到持久化流程: 爬虫文件爬取到数据后,需要将数据封装到items对象中. 使用yield关键字将items对象提交给p ...