自1999年成立至今,Apache 软件基金会已成功建立起自己强大的生态圈。其社区涌现了非常多优秀的开源项目,同时有越来越多国内外项目走向这个国际开源社区进行孵化。据悉,目前所有的 Apache 项目都需要经过孵化器孵化,满足一系列质量要求之后才可毕业。从孵化器里毕业的项目,要么独立成为顶级项目,要么成为其他顶级项目的子项目。

为便于大家了解 Apache 孵化的标准,本文盘点了 Apache 从2016年1月1日至2017年1月19日所有孵化成功并独立管理的顶级项目,共有11个。同时,欢迎大家在评论区留言互动,聊聊对 Apache 的看法,分享曾经使用过的感受..

1、Apache Beam

Apache Beam 是 Google 在2016年2月1日贡献给 Apache 基金会的孵化项目,于2017年1月10日正式宣布毕业,升级为 Apache 顶级项目。

Apache Beam 的主要目标是统一批处理和流处理的编程范式,为无限,乱序,web-scale的数据集处理提供简单灵活,功能丰富以及表达能力十分强大的SDK。项目重点在于数据处理的编程范式和接口定义,并不涉及具体执行引擎的实现。Apache Beam 希望基于 Beam 开发的数据处理程序可以执行在任意的分布式计算引擎上。

2、Apache Eagle

Apache Eagle 起源于 eBay,最早用于解决大规模 Hadoop 集群的监控问题,2015年10月26日提交给 Apache 进行孵化,于2017年1月10日正式宣布毕业成为 Apache 顶级项目。

Apache Eagle 是一个开源监视和警报解决方案,用于智能实时地识别大数据平台上的安全和性能问题,例如 Apache Hadoop、Apache Spark 等。Apache Eagle 主要包括:高可扩展、高可伸缩、低延时、动态协同等特点,支持数据行为实时监控,能立即监测出对敏感数据的访问或恶意的操作,并立即采取应对的措施。

3、Apache Geode

Apache Geode 最初是由 Gemstone Systems 公司作为商业产品开发,初期被广泛应用在金融领域,作为事务性、 低延时的数据引擎用于华尔街交易平台。2015年4月27日将代码提交给 Apache 孵化器,于2016年11月21日毕业成为 Apache 顶级项目。

Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用。它使用了动态数据复制和分区技术来实现高可用、高性能、高可扩展性、和容错。另外,对于一个分布式数据容器,Apache Geode 是一个基于内存的数据管理系统,提供了可靠的异步事件通知和可靠的消息投递。

4、Apache Twill

Apache Twill 于2013年11月14日将代码提交给 Apache 孵化器,2016年7月27日宣布毕业成为 Apache 顶级项目。

Apache Twill 为常见的分布式应用程序提供了丰富的内置功能,用于开发、部署和管理,大大简化了 Hadoop 集群操作和管理。目前已经成为 Cask 数据应用平台(CDAP)背后的关键组件,使用 YARN 容器和 Java 线程作为抽象化处理。CDAP 是一个开源集成和应用平台,使开发人员和组织能够轻松构建,在  Hadoop 和 Spark 上部署和管理数据应用。

5、Apache Kudu

Apache Kudu 是 Cloudera 主导开发的数据存储系统,2015年12月3日成为 Apache 孵化项目,2016年7月25日正式宣布毕业,升级为 Apache 顶级项目。

Apache Kudu 是为 Hadoop 生态系统构建的开源列式存储引擎,旨在实现灵活的高性能分析管道。它支持在传统数据库中提供许多操作,包括实时插入、更新和删除等。目前在许多行业的不同公司和组织中使用,包括零售、在线服务交付、风险管理和数字广告等等行业,还有大家较为熟悉的有小米公司。

6、Apache Bahir

Apache Bahir 的代码最初是从 Apache Spark 项目中提取的,后作为一个独立的项目提供,并于2016年6月29日宣布成为 Apache 顶级项目。

Apache Bahir 通过提供多样化的流连接器(streaming connectors)和 SQL 数据源扩展分析平台的覆盖面,最初只是为 Apache Spark 提供拓展,目前也为 Apache Flink 提供,后续还可能为 Apache Beam 和更多平台提供拓展服务。

7、Apache Zeppelin

Apache Zeppelin 是一个支持交互式数据分析的基于 Web 的 notebook,提供了数据可视化的框架。2013年在 NFLabs 作为商业数据分析产品 Peloton 面世,2014年12月23日进入 Apache 孵化器,2016年5月25日毕业为 Apache 顶级项目。

Apache Zeppelin 帮助开发人员高效处理数据,而不必担心命令行和群集详细信息。支持20多个后端系统,易于部署和使用,允许用户混合不同的语言,在后端之间交换数据,调整布局,也允许自定义可视化和集群资源之间的交互。你可以使用 SQL、Scala 等创建漂亮的数据驱动、交互式和协作文档。

8、Apache TinkerPop

Apache TinkerPop 2009年始于洛斯阿拉莫斯国家实验室,在发布过2个版本后,于2015年1月16日提交给 Apache 孵化器,并于2016年5月23日毕业为 Apache 顶级项目。

Apache TinkerPop 是一个图形计算框架,为开发人员提供在任何应用程序领域构建任何规模的现代图形应用程序所需的工具。它统一了这些高度变化的图形系统模型,加快开发时间,既可用于联机事务处理(OLTP),又可用于联机分析处理系统(OLAP);既可处理单一机器的数据,也可处理分布式环境的庞大数据。

9、Apache Apex

Apache Apex 最初于2012年在 DataTorrent Inc. 创建,2015年8月17日进入 Apache 孵化器,2016年4月25日正式宣布毕业为 Apache 顶级项目。

Apache Apex 是一个企业级的统一流和批处理引擎。提供高度可伸缩、高性能、容错、有状态、安全和分布式的大数据处理,同时操作起来非常简单容易。其目的在于充分利用 Hadoop 的两大组件 YARN 和 Hadoop 分布式文件系统(HDFS)提供的基础设施,通过企业级平台对 Apache Hadoop 进行流式分析。

10、Apache Sentry

Apache Sentry 为 Hadoop 集群元数据和数据存储提供集中、细粒度的访问控制,2013年8月成为 Apache 孵化项目,2016年3月25日毕业为 Apache 顶级项目。

Apache Sentry 是一个加强的细粒度的基于角色的授权系统,对不同的 Hadoop 组件提供了六类对权限访问策略管理。包括:支持多权限模型,也支持同一个权限控制策略对多哥计算框架和数据目录的访问;支持Apache Solr(搜索项目);支持 SQL 表权限和 HDFS 文件权限同步;支持数据管理的审计日志;支持高可用性(HA);支持不同集群间权限策略的导入和导出等等。

11、Apache Arrow

Apache Arrow 最初是基于 Apache Drill 项目的代码进行开发的,它是在许多开源协作的基础上构建的,为列式内存存储的处理和交互提供了规范,于2016年2月17日毕业成为 Apache 顶级项目。

Apache Arrow 通过提供高性能的列式内存表示来加速分析处理。许多处理算法从该存储器设计中获益良多。除了传统的关系数据,Arrow 还支持具有动态模式的复杂数据。例如,可以处理通常用于 IoT 工作负载、现代应用和日志文件中的 JSON 数据,也可以允许在大量大数据解决方案之间实现更强的互操作性。

 
转载 http://www.lupaworld.com/article-262239-1.html

盘点Apache毕业的11个顶级项目的更多相关文章

  1. 盘点 35 个 Apache 顶级项目,我拜服了…

    Apache 软件基金会 Apache 软件基金会,全称:Apache Software Foundation,简称:ASF,成立于 1999 年 7 月,是目前世界上最大的最受欢迎的开源软件基金会, ...

  2. 官宣!DolphinScheduler 毕业成为 Apache 软件基金会顶级项目

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021年4月9日在官方渠道宣布Apache DolphinScheduler 毕业成为Apache顶级项目.这 ...

  3. Dubbo下一站:Apache顶级项目

    导读: 近日,在Apache Dubbo开发者沙龙杭州站的活动中,阿里巴巴中间件技术专家曹胜利(展图)向开发者们分享了Dubbo2.7版本的规划. 本文将为你探秘 Dubbo 2.7背后的思考和实现方 ...

  4. 官宣!ASF官方正式宣布Apache Hudi成为顶级项目

    马萨诸塞州韦克菲尔德(Wakefield,MA)- 2020年6月 - Apache软件基金会(ASF).350多个开源项目和全职开发人员.管理人员和孵化器宣布:Apache Hudi正式成为Apac ...

  5. Apache 软件基金会顶级项目 Pulsar 达成新里程碑:全球贡献者超 300 位!

    各位 Pulsar 社区小伙伴们: 今天我们高兴地宣布Pulsar 达成新里程碑,全球贡献者超 300 位! 距离 Pulsar 实现 200 位贡献者里程碑,仅仅间隔 8 个月! 作为 Apache ...

  6. 我给 Apache 顶级项目提了个 Bug

    这篇文章记录了给 Apache 顶级项目 - 分库分表中间件 ShardingSphere 提交 Bug 的历程. 说实话,这是一次比较曲折的 Bug 跟踪之旅.10月28日,我们在 GitHub 上 ...

  7. Apache 顶级项目 Apache Pulsar 成长回顾

    关于 Apache Pulsar Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息.存储.轻量化函数式计算为一体,采用计算与存储分离架构设计,支 ...

  8. 顶级项目孵化的故事系列——Kylin的心路历程【转】

    现在已经名满天下的 Apache Kylin,是 Hadoop 大数据生态系统不可或缺的一部分,要知道在 Kylin 项目早期,可是以华人为主的开源团队,一路披荆斩棘经过几年的奋斗,才在 Apache ...

  9. Apache为mysql以及自己的项目设置虚拟路径

    参考 http://www.120xcjl.com  Apache为mysql以及自己的项目设置虚拟路径 1.Apache2.2\conf\httpd.conf中释放: Include conf/ex ...

随机推荐

  1. Android根据联系人姓名首字符顺序读取通讯录

      Android根据联系人姓名首字符顺序读取通讯录 版权声明:本文为Zhang Phil原创文章,欢迎转载!转载请注明出处:http://blog.csdn.net/zhangphil 本文给出了A ...

  2. 新闻内页 上一篇写一篇问题,ID不连续,不用链表

    y要什么链表? 用sql查询上一篇 SELECT id,title FROM t_article WHERE id<10 ORDER BY id DESC LIMIT 1; 用sql查下一篇 S ...

  3. 【DM642】H.264源代码在DM642上的移植

    TI公司提供了用于C语言开发的CCS(Code Composer Studio),该平台包括了优化的ANSI编译器,使之可以使用C语言开发DSP程序.这种方法不仅使DSP开发的速度大大加快,而且DSP ...

  4. Java常用的数据结构

    collection : List:arrayList,linkedList,vector set:treeSet ,hashSet; map: hashMap treeMap linkedHashM ...

  5. springboot 2 Hikari 多数据源配置问题(dataSourceClassName or jdbcUrl is required)

    springboot 2 Hikari 多数据源配置问题(dataSourceClassName or jdbcUrl is required) 最近在项目中想试一下使用 Hikari 连接池,以前用 ...

  6. 2019.10.30 csp-s模拟测试94 反思总结

    头一次做图巨的模拟题OWO 自从上一次听图巨讲课然后骗了小礼物以后一直对图巨印象挺好的233 T1: 对于XY取对数=Y*log(x) 对于Y!取对数=log(1*2*3*...*Y)=log1+lo ...

  7. JS的闭包问题

    1.什么是“闭包” 是一个拥有许多变量和绑定了这些变量的环境的表达式(通常是一个函数),因而这些变量也是该表达式的一部分. 2.闭包的应用场景 (1)保护变量的安全实现JS私有属性和私有方法 (2)在 ...

  8. Acesrc and Travel

    Acesrc and Travel 时间限制: 1 Sec  内存限制: 128 MB 题目描述 Acesrc is a famous tourist at Nanjing University se ...

  9. LUOGU P4095 [HEOI2013]Eden 的新背包问题

    题目描述 " 寄 没 有 地 址 的 信 ,这 样 的 情 绪 有 种 距 离 ,你 放 着 谁 的 歌 曲 ,是 怎 样 的 心 情 . 能 不 能 说 给 我 听 ." 失忆的 ...

  10. Java问题解读系列之基础相关---含继承时的执行顺序

    今天来研究一下含继承.静态成员.非静态成员时Java程序的执行顺序: 一.不含继承,含有静态变量.静态代码块 创建一个子类,该类包含静态变量.静态代码块.静态方法.构造方法 /** * @create ...