项目地址

https://github.com/Alluxio/alluxio/tree/branch-2.0-preview

2.0版本-构思和设计

支持超大规模数据工作负载

Alluxio作为计算和存储之间的数据编排层,使数据移动并且可以跨多个不同的存储系统访问:HDFS,对象存储,网络附加存储,随着时间的推移,Alluxio需要的元数据支持规模 提供可以轻松超过最大的Hadoop部署。 特别是元数据管理被认为是Hadoop的弱点,但Alluxio应该将元数据管理变成一种优势。

更友好的数据工程界面

Alluxio的创建重点是基于Hadoop的计算工作负载。 但是多年来,数据密集型计算工作负载的数量和类型已经爆炸式增长,并且在现有数据或新数据存储系统上实现这些工作负载的数据编排和工程设计非常重要。 特别是,在机器学习和深度学习培训之前,需要许多数据工程,包括手动数据移动。 Alluxio应该通过为数据科学家提供本地已知API同时减少所需的数据工程来大大简化这一过程。

使存储和计算更加分离

整个企业中的数据孤岛只会随着跨多个Hadoop集群的数据而增加,越来越多地存在于许多不同的对象存储中,并且在一些情况下存储在内部或公共云中。 这使得计算与数据分解变得更加困难,因为数据处理被移动到与存储数据的位置不同的位置时,数据位置和访问受到严重影响。 Alluxio应该通过抽象存储同时使数据更易于访问,继续实现计算和存储的分离。

2.0版本-进步和功能

Alluxio 2.0包含许多增强功能,以支持项目的设计目标,所有开源都将包含在Community Edition中!

支持超大规模数据工作负载

  • 支持超过10亿个文件 - 2.0引入了分层元数据管理的新选项,以支持具有超过10亿个文件的单个群集部署。我们使用RocksDB进行非堆存储,现在是默认的。热数据的元数据继续存储在堆上的进程内存中,而其余元数据由进程内存外的Alluxio管理。 alluxio.master.metastore可以配置为仅更改为堆。
  • 高度分布式数据服务 - 2.0引入了Alluxio作业服务,这是一种分布式集群服务,现在可以使用复制,持久性,交叉存储移动和分布式负载等数据操作,从而实现高性能和大规模扩展。看一下Alluxio支持的所有文件系统API。
  • 增强数据局部性的自适应复制 - 为自动管理的Alluxio中存储的数据副本配置范围的新功能。 alluxio.user.file.replication.max和alluxio.user.file.replication.min可用于指定范围。可在此处找到所有用户配置的完整列表
  • 嵌入式日志的高可用性 - 文件和对象元数据的新容错和高可用性模式称为嵌入式日志,它使用RAFT一致性算法,独立于任何其他外部存储系统。这对于抽象对象存储特别有用。了解如何在此配置嵌入式日记

在任何存储上启用机器学习和深度学习工作负载

机器学习和深度学习框架需要从Hadoop和对象存储中提取数据,这通常是一个非常手动且耗时的过程。

  • Alluxio POSIX API Alluxio的FUSE功能支持POSIX兼容API,因此TensorFlow,Caffe和其他基于Python的模型等框架可以使用传统的文件系统访问通过Alluxio直接访问任何存储系统中的数据。了解有关POSIX API的更多信息。

更好的存储抽象,实现完全独立和弹性的计算

  • 支持不同版本的HDFS集群 - 数据的爆炸性增长导致企业拥有许多数据孤岛,包括跨多个不同版本的多个Hadoop集群。目前,跨这些集群的统一访问非常困难。使用Alluxio 2.0,用户可以使用Alluxio的任何版本连接到多个HDFS集群,并统一数据访问。在此处查找支持的HDFS版本列表。
  • 与Hadoop主动同步 - 新功能与HDFS iNotify集成,可更新存储在Hadoop中的文件所发生的任何数据和元数据更改,允许应用程序通过Alluxio访问数据,以主动接收最新更新。

原文地址:https://www.alluxio.com/blog/announcing-alluxio-20-preview-enabling-hyper-scale-data-workloads-in-the-cloud

alluxio2.0特性-预览的更多相关文章

  1. C# 9.0 新特性预览 - 类型推导的 new

    C# 9.0 新特性预览 - 类型推导的 new 前言 随着 .NET 5 发布日期的日益临近,其对应的 C# 新版本已确定为 C# 9.0,其中新增加的特性(或语法糖)也已基本锁定,本系列文章将向大 ...

  2. C# 9.0 新特性预览 - 空参数校验

    C# 9.0 新特性预览 - 空参数校验 前言 随着 .NET 5 发布日期的日益临近,其对应的 C# 新版本已确定为 C# 9.0,其中新增加的特性(或语法糖)也已基本锁定,本系列文章将向大家展示它 ...

  3. C# 9.0 新特性预览 - 顶级语句

    C# 9.0 新特性预览 - 顶级语句 前言 随着 .NET 5 发布日期的日益临近,其对应的 C# 新版本已确定为 C# 9.0,其中新增加的特性(或语法糖)也已基本锁定,本系列文章将向大家展示它们 ...

  4. C# 9.0 新特性预览 - init-only 属性

    C# 9.0 新特性预览 - init-only 属性 前言 随着 .NET 5 发布日期的日益临近,其对应的 C# 新版本已确定为 C# 9.0,其中新增加的特性(或语法糖)也已基本锁定,本系列文章 ...

  5. C# 6.0 功能预览

    C# 6.0 功能预览 (一) 一.索引的成员和元素初始化 1.1 原始初始化集合 Dictionary 1.2 键值初始化集合 Dictionary 1.3 运算符 $ 初始化集合 Dictiona ...

  6. HarmonyOS 3.0.0开发者预览版全新发布

    2021年10月22日在华为开发者大会HDC.Together 2021 主题演讲上,我们发布了HarmonyOS 3.0.0开发者预览版,主要内容包括:Harmony设计系统.ArkUI 3.0.A ...

  7. C# 6.0 功能预览 (二)

    在Language Feature Status上面看到,其实更新的并不是特别多,为了不会误导看了C# 6.0 功能预览 (一)的园友,现在把官方的更新列表拿了过来,供大家参考 Roslyn 编译平台 ...

  8. Spark3.0 preview预览版尝试GPU调用(本地模式不支持GPU)

    Spark3.0 preview预览版可以下载使用,地址:https://archive.apache.org/dist/spark/spark-3.0.0-preview/,pom.xml也可以进行 ...

  9. Windows Phone 8.1SDK新特性预览

    前言    Windows Phone 8.1的预览版将在近期推送,WP 8.1的SDK也已经进入到RC阶段,可以从这里安装.本次更新的SDK被直接集成到了VS2013Update2里面,不再是单独的 ...

随机推荐

  1. CSS属性过滤

    在前端领域,当我们想在ie6及以下版本和标准浏览器的样式不同我们怎么做呢 此时此刻不得不提到过滤器:即一种对特定浏览器显示和隐藏规则的声明方法 1.下划线属性过滤器 符合标准的浏览器都会忽略这个声明, ...

  2. java高并发系列-第1天:必须知道的几个概念

    java高并发系列-第1天:必须知道的几个概念 同步(Synchronous)和异步(Asynchronous) 同步和异步通常来形容一次方法调用,同步方法调用一旦开始,调用者必须等到方法调用返回后, ...

  3. Appium+python自动化(十九)- 猴哥失散多年的混血弟弟还是妹妹- Monkey(猴子)参数(超详解)

    简介 前边几篇介绍了Monkey以及Monkey的事件,今天就给小伙伴们介绍和分享一下Monkey的参数. 首先我们看一下这幅图来大致了解一下: 1.Monkey 命令 基本参数介绍 -p <允 ...

  4. Django rest framework(4)----版本

    目录 Django组件库之(一) APIView源码 Django restframework (1) ----认证 Django rest framework(2)----权限 Django res ...

  5. 个人永久性免费-Excel催化剂功能第103波-批量打开多文件或多链接

    有时简单的东西,却带来许多的便利,为了让大家可以记住并容易找寻到此功能,也将这么简单的功能归为一波,反正已经100+波了,也无需为了凑功能文章而故意罗列一些小功能带忽悠性地让人觉得很强大. 使用场景 ...

  6. Nodejs监控Apple召回计划&邮件提醒

    最近,我的MacBook Pro 2015款13寸电池膨胀了 把笔记本平放在桌面,四个脚中的前两个无法落地,笔记本盖合上之后,屏幕上会印上键盘的纹路,也就是说,笔记本C面D面变形了,已经购买超过3年, ...

  7. 从后端到前端之Vue(三)小结以及一颗真实的大树

    上一篇写了一下tab,下面整理一下用过的知识点,本想按照官网的文档,整理一下可以更清晰,结果也许是我的方法不对吧,总之更模糊了. 按照官网文档的顺序整理到了表单输入绑定之前,因为之前大致也就只涉及到这 ...

  8. [Github]watch和star的区别

    1. Watch Issues 以及它们的评论 Pull Requests 及评论 对任何提交的评论 如果没有watch,只有在参与了讨论的情况下会接收到提醒 : 被 @ 提及 被分配 Issues ...

  9. mysql8.0.15创建数据库和是删除数据库及用户删除

    1.首先安装mysql8.0.15 2.Mysql8.0.15安装成功后,默认的root用户密码为空,用以下命令来登录root用户: mysql –u root –p 记住密码不用输入 3.进入之后修 ...

  10. sklearn学习 第一篇:knn分类

    K临近分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类. 一,kNN算法的逻辑 kNN算法的核 ...