在9月16日召开的“2022 OSCAR开源产业大会”上,中国信息通信研究院发布了一系列开源研究成果和开源表彰,网易数帆发起的开源项目Apache Kyuubi荣获“OSCAR尖峰开源项目及开源社区”,有数大数据基础平台NDH荣获“OSCAR尖峰开源技术创新(二次开发)”。

此外,网易数帆发起的云原生开源项目Slime和Curve分别获得了“可信开源社区共同体(TWOS)”和“TWOS 银河计划成员”的授牌。

“OSCAR开源尖峰案例”评选旨在为开源产业发展立标杆、树典范,已开展多年,可谓中国开源领域的奥斯卡,可信开源社区则致力于推动开源社区发展和落地应用。网易数帆获得权威评选的认可,再次证明了公司构建的开放式大数据架构的先进性,及践行“架构开放,内核开源”理念的决心。

Apache Kyuubi:社区成熟,毕业可期

Kyuubi作为一个封装SparkSQL的服务诞生,将多租户、高可用和分布式等企业级特性引入开源大数据的世界,因其实用性受到了社区用户的关注。2021年6月,Kyuubi项目进入Apache软件基金会孵化,并在Apache Way的指引下实现了更快的发展速度。依托本身的架构设计,Apache Kyuubi快速迭代,在Spark之外完成了Flink 、Trino(Presto)、Hive 等主流计算框架的支持,成为一个面向Serverless SQL on Lakehouse的服务,支持更加丰富的大数据场景应用,并被网易、阿里云、腾讯云、小米、华泰证券、广发证券、丁香园、eBay、T3出行、携程、爱奇艺、哔哩哔哩、womply、Houzz、kt NexR等国内外近百家企业采用。

网易数帆的开放式大数据架构中,Apache Kyuubi被视为统一SQL网关,用以屏蔽整个体系中不同存储、计算/查询引擎的差异,为数据中台提供支撑。

Apache Kyuubi的演进得益于社区的成熟,经过不到15个月的孵化,社区已经拥有93位代码贡献者,其中来自网易外部的贡献者占比超过了80%,充分体现了社区驱动的力量。最近,Apache Kyuubi被中国开源软件推进联盟主编的《2022中国开源发展蓝皮书》和InfoQ研究院编撰的《中国开源发展研究分析2022》列为中国开源大数据基础设施的代表。而今,在整个社区坚持不懈的努力下,Kyuubi从Apache基金会毕业可期,成为基金会顶级项目的目标不再遥远。

对于Apache Kyuubi的项目表现和社区发展态势,OSCAR评委专家均给予高度认可。

NDH:我左Spark,右Impala,Kyuubi在上面

作为一款企业级大数据基础平台,网易数帆有数大数据基础平台NDH的核心特点,一是兼容并增强Hadoop体系组件,二是完全自主掌握核心代码,这对于企业从原有大数据平台平滑迁移、满足自主可控要求来说都很重要。更为重要的是,有数大数据基础平台NDH基于最新开源技术打造,在业务支撑能力及性能上有更加出色的表现。

有数大数据基础平台NDH内置多种存储计算引擎,并在Hadoop、Spark、Impala等多个核心组件做了功能及性能增强(例如在Impala上实现虚拟数仓特性),还新增了智能运维和任务治理能力,支持企业级安全管控。这些能力的增强正是大规模生产落地的结晶,获得了评委专家的肯定。

有数大数据基础平台NDH原本作为网易数帆数据中台的底座提供,因市场需求,于今年6月作为单独的产品发布,此举也曾引发业界热议——网易数帆为何进军这门“不好的生意”。然而,这款产品在Impala和Kyuubi方面的积累和优势让从业者印象深刻。目前,有数大数据基础平台NDH已应用于银行、证券、流通、制造等行业三百多家企业客户生产环境。

Slime和Curve:持续完善开源云原生基础设施

Apache Kyuubi和有数大数据基础平台NDH是网易数帆开放式大数据架构的开源项目和商业产品代表,Slime和Curve则是网易数帆开源云原生基础设施的两大支柱,分别填补了服务网格智能管理和国产高性能云原生存储的空白。因其生态定位、架构设计的独特性以及社区发展前景,Slime社区和Curve社区分别受邀成为可信开源社区共同体(TWOS)成员和TWOS 银河计划成员,针对项目质量、社区发展、商业模式等话题加强开源社区之间的交流协作,不仅完善开源云原生基础设施生态,也助推国内开源产业健康、快速发展。

未来,网易数帆将继续秉承开放式思维拥抱开源,以扎实的产品实力和先进的技术实力为后盾,团结社区合作伙伴,持续为开源生态建设贡献力量。

构筑开放式大数据架构,Apache Kyuubi和NDH荣登开源OSCAR的更多相关文章

  1. 大数据架构-使用HBase和Solr将存储与索引放在不同的机器上

    大数据架构-使用HBase和Solr将存储与索引放在不同的机器上 摘要:HBase可以通过协处理器Coprocessor的方式向Solr发出请求,Solr对于接收到的数据可以做相关的同步:增.删.改索 ...

  2. 后Hadoop时代的大数据架构(转)

    原文:http://zhuanlan.zhihu.com/donglaoshi/19962491 作者: 董飞       提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年 ...

  3. 大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术

    大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选 ...

  4. 后Hadoop时代的大数据架构

    提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本.我把2012年后定义成后Hadoop平台时代,这不是说不 ...

  5. 一篇了解大数据架构及Hadoop生态圈

    一篇了解大数据架构及Hadoop生态圈 阅读建议,有一定基础的阅读顺序为1,2,3,4节,没有基础的阅读顺序为2,3,4,1节. 第一节 集群规划 大数据集群规划(以CDH集群为例),参考链接: ht ...

  6. 大数据架构师必读的NoSQL建模技术

    大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企 ...

  7. 阿里巴巴飞天大数据架构体系与Hadoop生态系统

    很多人问阿里的飞天大数据平台.云梯2.MaxCompute.实时计算到底是什么,和自建Hadoop平台有什么区别. 先说Hadoop 什么是Hadoop? Hadoop是一个开源.高可靠.可扩展的分布 ...

  8. 决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试

    决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试 [TOC] Apache ZooKeeper 单机模式安装 创建hadoop用户&赋予sudo权限, ...

  9. WOT干货大放送:大数据架构发展趋势及探索实践分享

      WOT大数据处理技术分会场,PingCAP CTO黄东旭.易观智库CTO郭炜.Mob开发者服务平台技术副总监林荣波.宜信技术研发中心高级架构师王东及商助科技(99Click)顾问总监郑泉五位讲师, ...

  10. 学习《深度学习与计算机视觉算法原理框架应用》《大数据架构详解从数据获取到深度学习》PDF代码

    <深度学习与计算机视觉 算法原理.框架应用>全书共13章,分为2篇,第1篇基础知识,第2篇实例精讲.用通俗易懂的文字表达公式背后的原理,实例部分提供了一些工具,很实用. <大数据架构 ...

随机推荐

  1. 使用tc命令模拟linux网络延迟环境

    tc(Traffic Control)是 Linux 中用于流量控制和网络模拟的强大工具.你可以使用它来模拟网络延迟.带宽限制.数据包丢失等. 以下是一个使用 tc 模拟网络延迟的基本步骤: 1.查看 ...

  2. Redis内存容量评估

    业务侧申请redis服务器资源时,需要事先对redis容量做一个大致评估,之前的容量评估公式基本只是简单的 (key长度 value长度)* key个数,误差较大,后期经常需要进行缩扩容调整,因此提出 ...

  3. Django - 在后台上传文章封面图 - 并在前端页面展示

    需要用到 models.ImageField(), 它继承自 models.FileField(),  用ImageField的时候需要安装pillow pip install pillow -i h ...

  4. 算法金 | 10 大必知的自动化机器学习库(Python)

    大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣] 一.入门级自动化机器学习库 1.1 Auto-Sklearn 简介: Auto-Skl ...

  5. CSP-S2019 江西 题解

    为什么有 \(5\) 道题? [CSP-S2019 江西] 和积和 简单化一下式子: \[(n + 1) \times \sum A_i \times B_i - (\sum A_i) \times ...

  6. liquibase常用操作

    1.概述 Liquibase是一个用于跟踪.管理和应用数据库变化的开源的数据库重构工具.它将所有数据库的变化(包括结构和数据)都保存在XML文件中,便于版本控制. 本文旨在将平时工作中常用的一些操作进 ...

  7. golang + postgresql + Kubernetes 后端学习

    记录 链接 dbdiagram 基于 Golang + PostgreSQL + Kubernetes 后端开发大师班[中英字幕]

  8. kylin-3.1.1-bin-hadoop3搭建,构建cube报的错误,Cannot modify dfs.replication at runtime. It is not in list of params that are allowed to be modified at runtime

    主要是每次构建cube时会去读取kylin安装目录下的conf/kylin_hive_conf.xml文件, 副本是无法在hive查询时修改的,注释掉这两项 这个其实还有一些参数的控制: 添加这俩个参 ...

  9. re.search()用法详解

    re.search() 是 Python 的正则表达式库 re 中的一个方法,用于在字符串中搜索与正则表达式模式匹配的第一个位置,并返回一个匹配对象.如果没有找到匹配项,则返回 None. 以下是 r ...

  10. python 二次封装logging,导致日志输出的filename错误及优化封装

    问题 封装logging文件名称为:A.py 调用A模块的文件名称为:B.py 二次封装了logging日志模块,根据需要,传入level,判断等级,调用logging模块的info.debug等日志 ...