2月15日,数仓软件巨头Teradata宣布根据其对中国当前和未来商业环境的慎重评估,将逐步结束在中国的直接运营,后续进入中国公司的关闭程序。

一石激起千层浪,这一消息,在国内的To B市场引起了广泛关注。Teradata这家进入中国市场26年,为国内数仓发展带来重要启蒙,奠定数据服务人才基础,被业界称之为 “数仓人才黄埔军校”的数据软件巨头如今在华落幕,令人感叹。

近些年来,国产大数据基础建设百花齐放、发展蓬勃,中国软件企业在信创产业政策的助攻下,迎来了发展的黄金期,技术和产品能力快速提升,凭借自主可控、创新安全等优势,已经逐步实现对Teradata等国外主流软件的成功替换。

其中包括以Hadoop体系为主的CDH、星环,袋鼠云等公司,以国产化数据库为主的阿里云ADB、华为GussDB、南大通用GBase等数据库厂商,都纷纷在国产化领域交出了不错的成绩单。

袋鼠云从2016年开始一直深耕于大数据领域,以卓越的技术能力服务3000+客户,涉及行业解决方案、大数据产品、数仓交建模交付、数据分析等多个领域。在产品和国际同行之间差距不断缩小的同时,这次Teradata的离开,我们也在思考在这块市场上袋鼠云可以为客户提供什么样的服务。

Teradata无缝迁移至数栈-EasyMR

Teradata是一个MPP数据库,采用share nothing架构,每个节点拥有自己的资源,如CPU、内存、磁盘等,每个APM管理自己的数据协同工作,通过BYNET进行网络互联。在业务场景上,主要应用于数据建模与分析。

该类数据库SQL兼容性好,支持事物处理、PB级别结构化数据处理速度快,但集群规模调整要求多,增加节点麻烦,单节点缓慢会拖累整体性能,在大数据量的处理任务上,有支持能力严重不足的问题。

如果客户数据量大,存储和计算成本较高,建议采用Hadoop大数据计算引擎生态,其兼容能力强、扩展性高,基于HDFS进行结构化、非结构化数据存储,Spark、Flink、Trino多类计算引擎可以满足不同分析场景。

袋鼠云数栈自研的大数据基础平台「EasyMR」,是基于Hadoop、Hive、Spark、Flink、HBase、Kafka、Trino等开源组件,构建的弹性计算引擎,提供安全可靠、弹性伸缩、低成本的大数据存储与计算服务。

于2017年投入商业化使用以来,交付过500+商业化客户,覆盖金融、政务、制造、教育等多个行业,期间开源ChunJun、Taier、ChengYing等项目,贡献给开源社区。并于2022年推出EasyMR数据湖版本,在业务场景驱动下,不断完善技术体系,服务大数据市场。

EasyMR可提供的场景解决方案

· ChunJun数据同步插件:双向异构数据源、批流一体的数据同步插件,实现业务数据库向大数据数仓的数据同步,可进行数据整库同步、批同步、实时同步;

· Spark+Hive:分布式离线数据仓库建设,进行数据批处理;

· Spark+Hive+Iceberg/Hudi:离线数仓批处理+数据即时更新;

· Kafka+Flink:实时数据仓库建设;

· Flink+Kafka+Iceberg/Hudi:批流一体化;

· Trino+Hive:OLAP引擎进行亿级数据关联的秒级查询;

· ClickHouse:OLAP引擎进行宽表的毫秒级查询;

· HBase:大数据量存储,高并发快速查询。

Teradata数据库迁移至EasyMR,数栈可提供的服务

· 历史数据的整库迁移;

· Teradata SQL任务的平滑迁移。

袋鼠云大数据基础平台「EasyMR」秉承“信创、开源、轻量、专业”的理念提供安全可靠的大数据存储与计算服务,为企业数字化转型提供基石。

数栈兼容Teradata Vantage数据分析

Teradata Vantage 是一个云计算数据分析平台,提供数据汇聚与建模、数据服务与分析、机器学习建模等能力,同时预置行业数据模型,如FS-LDM涵盖银行、证券、保险的10大主题模型,为客户提供数据分析服务。

袋鼠云数栈提供一站式大数据开发与治理数据智能分析与洞察机器与深度学习建模等产品化应用,涵盖离线开发、实时开发、数据资产、数据服务、指标管理分析、客户数据洞察等平台。

提供大数据汇聚、数仓建模、数据治理、数据服务、数据分析的全生命周期能力,并基于Dataops理念构建数据生产流程,加快数据分析链路,为企业数据治理提供易用、稳定的数据平台,达到降本增效的目的。



袋鼠云数栈产品矩阵

· 离线开发平台BatchWorks:一站式大数据批处理平台,涵盖全链路数据集成、数据开发、任务运维、监控告警等功能,具备灵活的多集群、多引擎对接能力,加速释放数据价值;

· 实时开发平台Streamworks:基于Apache Flink 构建的云原生一站式大数据实时平台,覆盖从实时数据采集到实时数据开发全链路流程,提供亚秒级的数据计算处理;

· 数据资产平台DataAssets:采集全量资产数据,打通数据关系网络,实现数据的标准化和资产化管理,提供全域数据治理能力;

· 数据服务平台EasyAPI:可视化生成与注册 API 的数据服务管理平台,快速构建 OneService 数据共享服务;

· 指标管理分析平台EasyIndex:通过指标的规范化定义、标准化开发,搭建企业数据指标体系与自助取数服务,实现指标数据的可视、可用、可管;

· 客户数据洞察平台DataTag:通过标签萃取、标签管理、标签圈群、群组分析、全面画像,构建以业务价值为导向的标签体系和多样化群组,应用于企业智能化运营与营销

· 数据湖平台EasyLake:提供面向湖仓一体的数据湖管理分析服务,基于统一的元数据抽象构建一致性的数据访问,提供海量数据的存储管理和实时分析处理能力,帮助企业快速构建湖仓一体化平台。

同时,数栈基于在金融、政府、制造、教育等各个行业的客户场景沉淀,产品内置多种行业的数据标准、数仓模型、指标体系、标签体系,为企业数据建设提供参考与赋能,以及提供全国性、本地化的行业咨询与数据交付实施服务。下面简单举几个例子:

● 数据标准行业模板

● 指标体系行业模版

● 标签体系行业模版



不止于此,数栈提供全生命周期的数据建模与服务能力,并预置多种行业模型,为企业数字化转型提供框架与动能。

国产信创,数栈在路上

2月22日,***在政治局集体学习会议上强调:“要打好科技仪器设备、操作系统和基础软件国产化攻坚战,提升国产化替代水平和应用规模,争取早日实现用我国自主的研究平台、仪器设备来解决重大基础研究问题。“

近些年来,在国家政策指导下,企业数字化基础设施逐步国产化。袋鼠云作为国内领先的数字化技术与服务提供商,始终坚持自主研发和国产化路线,高度重视技术创新,公司研发费用逐年提升,研发费用占比高达20%以上,高于行业研发投入的平均水平。

目前,袋鼠云已与麒麟软件、中科方德、浪潮云、华为云、阿里云、瀚高、龙芯科技、中兴通讯等16家国内主流操作系统、服务器、数据库、芯片厂商完成产品兼容性互认证。这大大提升了袋鼠云旗下产品在国内企业应用环境中的兼容性和扩展性,在软硬件层面全面兼容X86、ARM、MIPS架构体系,支持市面所有公有云、私有云、混合云厂商平台,支持CDH、TDH、Libra、Fushionlnsight等存储引擎。

未来,袋鼠云将继续秉承“让数据创造价值”的使命,在大数据道路上持续深耕,为企业的数字化转型贡献自己的一份力量。

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szbky

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术qun」,交流最新开源技术信息,qun号码:30537511,项目地址:https://github.com/DTStack

Teradata在华落幕,国产化崛起,袋鼠云数栈会是更好的选择吗?的更多相关文章

  1. 袋鼠云出品!数栈UI 5.0全新体验升级,设计背后的故事

    我们是袋鼠云数栈 UED 团队,致力于打造优秀的一站式数据中台产品.我们始终保持工匠精神,探索前端道路,为社区积累并传播经验价值. 前言 数栈作为云原⽣⼀站式⼤数据开发平台,从2016年发布第⼀个版本 ...

  2. 袋鼠云研发手记 | 开源·数栈-扩展FlinkSQL实现流与维表的join

    作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...

  3. 袋鼠云研发手记 | 数栈·开源:Github上400+Star的硬核分布式同步工具FlinkX

    作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...

  4. 华夏基金X袋鼠云:基金业数字化转型,为什么说用户才是解题答案?

    "精准营销是以客户为中心,运用各种可利用的方式,在恰当的时间,以恰当的价格,通过恰当的渠道,向恰当的顾客提供恰当的产品." 这是学者许瑾在科特勒精准营销理论的基础上,从实践的角度对 ...

  5. 袋鼠云研发手记 | 袋鼠云EasyManager的TypeScript重构纪要

    作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...

  6. 袋鼠云旗下新公司云掣科技启航,深耕云MSP业务助推企业数字化转型

    1983年3月15日,国际消费者联盟组织将3月15日确立为国际消费者权益日. 2019年3月15日,袋鼠云举办三周年年会. 一生二,二生三,三生万物.植树节后,万物生长. 年会现场,袋鼠云宣布成立新公 ...

  7. ByteHouse云数仓版查询性能优化和MySQL生态完善

    ByteHouse云数仓版是字节跳动数据平台团队在复用开源 ClickHouse runtime 的基础上,基于云原生架构重构设计,并新增和优化了大量功能.在字节内部,ByteHouse被广泛用于各类 ...

  8. 阿里云数加平台——BI报表使用概述和总结

    先声明一点,本人写此文章初衷只为对前段时间的工作做些总结,并做个记录,以备日后查用,此外也顺便与他人分享一下.当然间接上也为阿里云的大数据平台做了个免费广告.以下开始正文. 首先进入数加服务的控制面板 ...

  9. 腾讯云VS AWS :云存储网关性能谁更优?

    p { text-indent: 2em }    随着企业规模的扩大及业务的扩展,现有IT基础设施特别是存储设备无法满足爆炸性的数据增长,企业 IT 部门为了解决该问题,往往面临市场上多种存储产品及 ...

  10. 云如何让App开发更简单?

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 互联网"下半场",移动App开发对于质量.速度的要求更加苛刻.4月初,腾讯云正式上线移动开发平台MobileLine,借 ...

随机推荐

  1. 使用LLaMA-Factory训练LLM大模型并用ollama调用

    环境搭建 系统环境 需要Nvidia显卡,至少8G显存,且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘,方便重装或移植 以Windows11为例,非安装环境文件都放在 E ...

  2. 再谈MCP协议,看看 MCP 是如何重塑 AI 与外部数据源互动的能力?

    Techscribe Central 缩略图由 Techscribe Central 制作和编辑 MCP!!是不是一头雾水?我当时也是这个反应.我也是最近才听说它开始引发关注,然后我发现大多数人根本不 ...

  3. 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密

    引言 最近遇到了一个 ActiveMQ 消费端的问题:在没有消息时,日志频繁打印,每秒打印2000多条空消息,导致日志文件迅速膨胀,甚至影响系统性能.经过一番排查,最终定位到问题根源并成功解决.本文将 ...

  4. 超简单电脑本地部署deepseek,另附”一键使用脚本“撰写与联网使用方法

    在电脑上部署deepseek,总共分三步 1.打开ollama官网点击Download按钮 2.在ollama官网搜索deepseek-r1模型,选择对应规模,并复制ollama命令,比如这里,我的o ...

  5. 【Windows】如何关闭Windows10、Windows11自动更新

    如何关闭Windows10自动更新 零.问题 Windows10老是自动更新,有时候第二天起来又得重新打开软件,真麻烦,Win10自动更新的时候还有点卡. 如何关闭? 经过上网查询,发现完全关闭难度比 ...

  6. nodejs终端字符样式和进度条

    Nodejs为终端字符增加样式 只有黑白的色调对于比较复杂的命令行程序来说就显得太单调了,我们可以为命令行程序增加样式使得程序更加友好! 安装package: npm install -S chalk ...

  7. ubantu&windows搭建gis开发环境(qt+osg+osgearth+osgqt)

    一.ubantu22.04中搭建地图开发环境(qt5.15.2 + osg3.7.0 + osgearth3.7.1 + osgqt) (1)下载安装qt5.15.2 : (2)下载编译安装osg3. ...

  8. jmeter csv变量随机取值的方法

    默认的CSV文件取值是按照顺序从第一行开始取值的,需要随机取值,可安装扩张插件实现 首先安装插件 下载第一个:https://jmeter-plugins.org/downloads/old/ 下载第 ...

  9. eolinker解决两个变量合并成一个变量提供其他接口使用的方法

    特别注意:需要使用全局变量或者预处理前务必阅读本链接https://www.cnblogs.com/becks/p/13713278.html 场景描述:提交订单的接口请求中,有一参数是由商品价格+运 ...

  10. Go 语言的数据类型转换有哪些?

    当不同的数据类型相互操作的时候,就需要类型转换,Go 的数据类型转换还是比较简单的. 数据类型转换包含显式和隐式两类,隐式的一般是大的数据类型到小的类型进行转换,不会有精度丢失的问题.否则就需要进行显 ...