导读: 时序数据库(Time Series Database)在最近几年被越来越多的用户接受并使用,并有广泛的应用场景。云原生时序数据库 TDengine 一直稳居墨天轮时序数据库榜首,其近期的海外发展也初见成效。本期,墨天轮技术社区邀请到了涛思数据领航者——陶建辉先生,针对公司创立初心、时序数据库未来发展趋势、数据库出海等话题展开探讨,同时有过三次创业经历的他也将分享自己的心得体会,以及对数据库从业者未来发展的建议!

涛思数据创始人&CEO —— 陶建辉 

TDengine 创始人与核心开发。1994年到美国留学,1997年起,先后在芝加哥 Motorola、3Com 等公司从事无线互联网的研发工作。2008年初回到北京创办和信,后被联发科收购。2013年初创办快乐妈咪,后被太平洋网络收购。2017年5月创办涛思数据,专注物联网大数据的处理,产品 TDengine 开源后,在 GitHub 全球趋势排行榜上多日排名第一。涛思数据已获红杉、GGV、经纬、明势资本等多家机构的近7000万美元的投资。

—— 以下为采访全文 ——

墨天轮社区:您创业选择的行业多样,从通讯、母婴行业再到现在的时序数据库,跨越的幅度也比较大,您最后选择时序数据库是基于怎样的初衷?

陶建辉:我上一家创业公司是做母婴智能硬件,智能硬件产生的数据都是时序数据,因此让我了解到了时序数据这样的场景。在公司被收购后,我看了很多智能硬件、物联网、工业互联网的项目,觉得时序数据的处理是一个共性的、相对标准的需求。而且2016年自动驾驶很火,自动驾驶能产生海量的时序数据,分布式能源也是很多人讨论,这些分布式能源系统产生的数据也是海量的,因此我认为时序数据处理将成为一个重要的技术领域。

调研发现市场上已经有 InfluxDB、OpenTSDB 这些产品,但这些产品做得一般般,并没有充分利用时序数据的特性,而当时 InfluxDB 已经融资6000多万美元,因此我认为这是一个值得创业的赛道。2016年底就自己动手开始写程序,验证自己提出的 “一个数据采集点一张表” 这一数据模型的效率,测试发现,居然写入和查询性能至少比 InfluxDB 快五倍以上,因此我就正式决定融资、组建团队,这样,涛思数据在2017年6月就正式成立了。

墨天轮社区:TDengine 在开源方面是比较成功的,如何在开源的同时实现商业化?

陶建辉:当前 TDengine 主要通过企业版和云服务实现商业化。相比开源版,TDengine 企业版拥有更多企业所需要的数据库运营维护功能,比如数据备份、容灾、加密、安全传输,以及可视化的管理界面、数据的多级存储、边云协同等等。但开源版与企业版的核心功能都是完全一样的。

云服务更多的是面向中小企业用户,是全托管的时序数据处理平台,这也将是我们今后很重要的收入来源。

墨天轮社区:相较于 InfluxDB,TDengine 有哪些差异化的优势?目前您认为 TDengine 最成功的标杆应用案例是什么?

陶建辉:相对于 InfluxDB, TDengine 有以下几方面的优势:

  • 超强性能,基于全球公认的时序数据基准测试结果来看,TDengine 的写入性能是其 3.0 ~ 10.6倍, TDengine 的查询性能是其 1.9 ~ 37.0 倍,平均 11.3 倍,磁盘空间的占用也有明显优势;
  • TDengine 不仅只是一个时序数据库,它还带有缓存、数据订阅、流式计算的功能,是一个极简的时序数据处理平台,这样能大幅降低整个数据平台设计的复杂度和运维成本;
  • TDengine 更简单易用,因为支持标准 SQL。

TDengine 最成功的标杆案例之一应该是跨越速运的车辆轨迹数据处理,在资源的节省方面极其显著。与 Hadoop 系统相比,采用 TDengine 之后,服务器台数由21台降为3台,磁盘空间由每日的352G降为4G,而且运营维护变的极为简单,降低人力成本(详细请看:https://www.taosdata.com/user-cases/4863.html)。

墨天轮社区:最近 AI 热潮来袭,TDengine 在人工智能方面有哪些发展成果及未来规划?

陶建辉:TDengine 一直再筹划进入人工智能领域,因为时序数据分析需要 AI 。我们早已规划用 AI 以及机器学习的方法来做时序数据预测以及时序数据的异常检测,而且通过插件的方式来提供,同时也提供一个分布式计算框架,用户还可以基于这个框架开发并运行自己的算法。这样,传统的基于简单规则的实时预警以及预测就会更加智能、精准,让用户能更好的洞察业务运营的状态,更快更好地做出商业决定,提升整个运营的效率。

墨天轮社区:数据库出海是一个老生常谈的话题。您认为现阶段TDengine的出海道路走得如何?针对中国数据库出海,您有哪些经验和心得分享一下吗?

陶建辉:TDengine 的出海还在尝试之中,已经花了一年时间了,有了一些初步效果。主要表现在两方面,首先,TDengine 英文网站的流量在大幅上升,每天总有人通过这个英文网站联系我们销售;其次,我们在北美已经有付费客户,越来越多的美国公司与 TDengine 在结成合作伙伴关系。

数据库乃至所有2B软件出海很不容易,目前还没有成功的先例。但是数据库软件要获得真正的成功,不沦落为一个系统集成商、软件定制开发商,必须走出海这条路。因为数据库软件是标准化的产品,与文化政治形态关系不大,适合全球推广。而在国内,为软件特别是底层软件买单的理念尚未形成,且整个中国市场不到全球市场的10%,如果放弃90%的市场不做,那很难与海外对手 PK,最后一定会失败。虽然中国在全力支持国产软件,但最终的选择权在用户手上,中国非军工、政府、国企的用户,最终一定会选择使用在全球最有竞争力的开源产品。这样只做国内市场的产品最终会很难过个好日子。

墨天轮社区:您认为目前国产时序数据库的落地情况如何?主要应用在了哪些领域?面临哪些困难和挑战?

陶建辉:中国是制造大国,目前又在全力推动数字化转型,因此时序数据库在中国有很多应用场景。从 TDengine 的安装实例就能看出,从2020年8月 TDengine 开源集群版后,已经有超过25万 TDengine 安装实例,遍布全球50多个国家,但近70%的安装还是在中国。因此中国是需要时序数据库的。

从我们用户来看,用户分布在电力、石油、石化、制造、汽车、矿山、烟草、交通、物流、食品等众多领域。所有需要采集数据的场景,都可以使用时序数据库

在中国面临的最大挑战就是用户不乐意花钱,即使购买,客单价也很难上去。还有一个,中国绝大部分企业还没有购买软件服务的意识,这样导致大部分合同还是永久License,而不是按年续费。

墨天轮社区:您认为初创公司如何才能招到高精尖人才、减少人才流失?

陶建辉:第一,待遇要到位,总的待遇包一定要超过华为、阿里、腾讯等企业,否则绝大部分高端人才不会加盟;第二,要有梦想,公司的发展要有足够大的空间和市场价值,这样优秀人才的个人价值才能充分体现。减少人才流失,不外乎几个手段:

  • 待遇需要依据市场的变化做出调整;
  • 打造企业文化和价值观,多关心员工并处处为他着想,让他感觉到被尊重、是公司大家庭的一份子;
  • 要多交给有挑战性的工作,让他觉得有施展才华的舞台,让他能看到公司的成长以及他个人的成长。

墨天轮社区:您创业到现在有15年了,讲讲您最难的时候。为什么会陷入危机? 是怎么渡过的?

陶建辉:我创业最难的时候,是2010年年初,公司(和信)一分钱都没有了,办公室因为拖欠房租都被封了,完全是走投无路。但我当时坚信,我做的手机消息推送服务一定有市场,技术绝对领先,因此我就咬牙扛了下来,找同学、朋友借钱度过的难关。幸运的是,我坚持几个月后,和信就被台湾的联发科收购了。

墨天轮社区:都说35岁是技术从业者的一道坎,面对年龄焦虑,您认为数据库从业者如何摆正心态、坦然面对?

陶建辉对于数据库开发而言,35岁是刚刚开始的年龄。 要成为系统软件的开发高手,大学毕业后,如果没有十年以上的技术磨炼,是难开发操作系统、数据库这类软件的。而且这十年,是需要有研发高手指导、参与过同样复杂度软件开发的。另外一方面,应用软件的开发每一年都不同,各种语言、工具层出不穷,但对于数据库的开发而言,五年、十年都几乎没有什么变化,因为底层技术的改变是缓慢的,很适合35岁以后的人来做,因此数据库的研发特适合能坐得住、能且乐意啃硬骨头的人做


阅读原文:https://www.modb.pro/db/633711

欲了解更多可浏览墨天轮技术社区,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。

墨天轮专访TDengine陶建辉:坚持做难而正确的事,三次创业成就不悔人生的更多相关文章

  1. TDengine陶建辉 自带聚光灯&BGM的半百少年

    TDengine,这款定位为“专为物联网而生的大数据平台”,引爆了2019年夏天的软件圈. 2019年7月12日,涛思数据宣布将TDengine的内核(存储和计算引擎)以及社区版100%开源. 201 ...

  2. three.js实现分模块添加梦幻bloom辉光光晕方案--详细注释版本~~方案三版本~~

    先上图对比方案1-2-3不同点,本文是方案3 方案1(旋转场景情况下发光体不应该遮住另一个,但是遮住了) 方案2(层次正常,发光正常) 方案3(层次正常,发光正常,但是转动场景时候部分辉光会被遮挡,但 ...

  3. 万字详解 TDengine 2.0 数据复制模块设计

    ​导读:TDengine分布式集群功能已经开源,集群功能中最重要的一个模块是数据复制(replication),现将该模块的设计分享出来,供大家参考.欢迎大家对着设计文档和GitHub上的源代码一起看 ...

  4. 万字详解TDengine 2.0整体架构设计思路

    ​导读:涛思数据8月3日将TDengine 的集群功能开源,TDengine具有超强的性能和功能,为什么能做到?它到底有哪些技术创新?今将TDengine的整体设计文档分享出来. 1: 数据模型 物联 ...

  5. 第四朵“云”!全托管的时序数据云平台 TDengine Cloud 正式支持阿里云

    3 月 13 日,全托管的时序数据处理云服务平台 TDengine Cloud 正式支持阿里云,这是继 Microsoft Azure.AWS.Google Cloud 后 TDengine Clou ...

  6. OtterTune来了,DBA怎么办

    https://blog.csdn.net/xiangzhihong8/article/details/72887476 最近AI的新闻特别多,席卷了围棋圈之后,成为了技术圈和媒体热捧的话题. 今天又 ...

  7. 【科创人·独家】MegaEase左耳朵耗子陈皓复盘创业:第一年盈利被当骗子,线下广阔天地大有可为

    [科创人·独家]MegaEase左耳朵耗子陈皓复盘创业:第一年盈利被当骗子,线下广阔天地大有可为 原创: babayage CTO科创圈  与上百位科技创业者共同关注科创人的成长心路. 文末有彩蛋:& ...

  8. 60秒定位问题,十倍程序员的Debug日常

    作者:陶建辉 这是我在 2020 年 5 月写的一篇内部博客,当时是希望研发和技术支持同学能够帮助用户快速定位 Bug,解决问题.2020 年 12 月我又迭代了一版,并还针对此进行了内部的培训.这段 ...

  9. durex-word

    "(半夜没睡着) “你是不是饿了,哎呀我也饿了.”" "(聊到合拍处) “我和你有一万句me too想要说.”" "(异地恋) “我辞职,去你那儿吧! ...

  10. Go语言的成功也预示着Rust的成功【转】

    从整体的角度来看Go,很难理解他是怎么取得这么大的成功的.从理论的角度上来说Go是一门非常糟糕的语言,就算是和C++或者Ada之类旧语言相比也是这样. 从整体的角度来看Go,很难理解他是怎么取得这么大 ...

随机推荐

  1. 使用ventoy安装windows10

    使用ventoy安装windows10 在ventoy中选择windows10镜像 进入Windows安装界面 下一步,选择现在安装 稍等片刻 选择我没有产品密钥 根据需求选择对应版本 下一步,接受许 ...

  2. 如何使用二阶优化算法实现对神经网络的优化 —— 分布式计算的近似二阶优化算法实现对神经网络的优化 —— 《Distributed Hessian-Free Optimization for Deep Neural Network》

    论文: <Distributed Hessian-Free Optimization for Deep Neural Network> 地址: https://arxiv.org/abs/ ...

  3. 强化学习中子进程调用atari游戏是否受父进程中设置的随机种子影响

    相关: python中numpy.random.seed设置随机种子是否影响子进程 ============================================ 代码: from ale_ ...

  4. uview-ui toast 二次封装

    开发用到uview 的toast 很常用的内容使用却很繁琐 所以做了简单封装方便使用 前后对比: this.$refs.uToast.show({ type: 'success', title: '成 ...

  5. centos7系统 通过编译安装gcc7.5.0

    背景: 现有的centos7 gcc的最高版本为4.8.5 项目需要升级到7.1.0以上 正常方式可以通过以下命令即可完成升级: $ sudo yum install centos-release-s ...

  6. Docker 之 RabbitMQ安装教程 基于腾讯云

    由于需要学习RabbitMQ(主要是项目启动了mq本地却没有服务控制台老是在连mq,致使我热部署都不知道到底成功没),所以才有了这个教程,下面介绍RabbitMQ准备工作 下载所需环境 yum -y ...

  7. 屏蔽RaiDrive的广告

    RaiDrive 广告域名:ads.raidrive.com 在 HOSTS 添加 127.0.0.1 ads.raidrive.com 或者在代理中设置为阻止即可. 效果: 补 最新版(2023.9 ...

  8. 一文带你理解URI 和 URL 有什么区别?

    当我们打开浏览器,要访问一个网站或者一个ftp服务器的时候,一定要输入一串字符串, 比如: https://blog.csdn.net/ 或者: ftp://192.168.0.111/ 这样我们就可 ...

  9. CF Div3 962 E-F

    CF Div3 962 E-F E. Decode 链接: Problem - E - Codeforces 简要题意: 给你一个长度为 \(n\) 的二进制字符串\(s\) .对于每一对整数\((l ...

  10. 常见 URI 协议

    mailto mailto 是一种 URI(统一资源标识符)协议,主要用于在 Web 页面中创建电子邮件链接.当用户点击使用 mailto 协议的链接时,系统会自动打开默认的电子邮件客户端,并在新邮件 ...