H2O Driverless AI(H2O无驱动人工智能平台)是一个自动化的机器学习平台,它给你一个有着丰富经验的“数据科学家之盒”来完成你的算法。

使AI技术得到大规模应用

各地的企业都意识到人工智能应用程序是推动更好的客户体验和增加利润的关键。在每家公司中,都需要成千上万的AI模型来实现自动化和增强工作流程,并加速新数字产品的创新。现有的机器学习系统需要昂贵的数据科学人才,需要数月才能开发和部署单一模型,并生成业务和监管机构均不信任的“黑匣子”模型。 H2O Driverless AI是一种自动化的机器学习平台,使数据团队能够扩展并提供可信赖的生产就绪(production-ready)模型,以应对这些挑战。

填补人才缺口

数据科学家目前很短缺。增加能够开发生产就绪AI模型技术人员的数量是填补数据科学人才缺口的关键。使用DriverLess AI,刚入门的数据科学家,数据工程师,领域专家和统计学家可以开发出高精度的准备就绪可以部署的模型。DriverLess AI由专业数据科学家开发,该平台可以执行高级数据科学家的任务,而要达到高级科学家的程度可能需要多年的时间来学习和完善。

花更少的时间建立更多的模型

减少开发精确产品就绪模型的时间是使用AI解决大量业务挑战的关键。DriveLess AI自动执行耗时的数据科学任务,包括高级特征工程(也特征值选取相关的工程)、模型选取、超参数调整、模型堆叠和模型部署。这些处理过程是由GPU和CPU系统的高性能计算驱动的,它可以在几分钟内进行数以千次的结合和迭代,通过不断测试来找出最佳模型。模型部署还通过自动计分管道实现流水线化,该流水线包括生产中运行模型需要的所有内容

可信任的AI结果

为了大规模的采用AI模型,业务团队和监管部门必须能够解释和信任AI结果。H2O DriveLess AI 提供高精度模型的同时也提供理解和共享模型结果的关键能力,包括机器学习可解释性(MLI)仪表盘,自动模型文档和为服务代表及客户提供的原因代码(reason code)。

H2O DriveLess AI的主要功能

AutoVis-大数据的探索性数据分析

H2O DriveLess AI 基于最相关统计数据自动选择数据视图来帮助用户在模型构建之前理解他们的数据。这对于理解超大数据集的组合及发现数据变化趋势和可能的问题(如大量数据值的丢失或可能影响建模结果的显著异常值)非常有用。

自动特征工程与模型构建

特征工程是高级数据科学家用来从算法中提取最准确结果的秘密武器。H2O DriveLess AI 采用算法库和特征转换为给定数据集自动设计新的、高价值的特征。界面中包含一个易读的变量重要性图表,它显示了原始值和新设计的特征值的重要性。

 机器学习可解释性(MLI)

H2O Driverless AI 提供可靠的机器学习技术和结果,包括自动生成的K-LIME,Shapley,变量重要性,决策树和部分依赖性图表。每个图表都有助于更密切地探索建模技术和结果。这些技术对那些必须向业务利益相关者和监管机构解释其模型的人至关重要。

自动原因代码

对于许多受监管的行业,需要对与客户相关的重大决策进行解释,例如拒绝信用贷款。原因代码用简单的语言显示模型评分决策中的关键的正面和负面因素。原因代码在其他设置中也很有用,例如医疗保健,因为它们可以提供对模型决策的洞察力,从而可以驱动额外的测试或调查。

自动模型文档(Auto Doc)

为了向业务用户和监管机构解释模型,数据科学家和数据工程师必须记录用于创建机器学习模型的数据,算法和过程。Driverless AI自动模型文档使用户免于在构建机器学习模型时记录和总结其工作流程的耗时任务。该文档包括所用到的数据,所选验证模式,模型和特征调整以及创建的最终模型的详细信息。借助Driverless AI中的这种功能,从业者可以更专注于从模型中获取可操作的洞察力,并在开发,验证和部署过程中节省数周甚至数月的时间。

 自动评分(为模型打分)管道

H2O Driverless AI 自动创建Python评分管道和新的超低延迟自动评分管道。新建的自动评分管道是一种单独的技术,它用来部署特征工程和获取最优的机器学习模型,或者它也可以集成在一个高度优化的,低延迟的生产就绪JAVA管道中,该管道可以部署在任何地方。这种技术对于运行模型的企业来说至关重要,这些模型需要在一系列设备上运行的实时应用程序上进行超快评分。

时序谱

时间序列预测是数据科学家面临的最大挑战之一。时间序列模型针对关键用例,包括需求预测,基础架构监控和基于事务,日志和传感器数据的预测性维护。 H2O DriveLess AI提供卓越的时间序列功能,可优化几乎任何预测时间窗口,整合来自众多预测变量的数据,处理结构化字符数据和高基数分类变量,并处理时间序列数据和其他缺失值的差距。

 企业数据访问和安全

为企业部署启用AI需要数据访问,可伸缩性和安全性。Driverless AI 支持企业数据访问,通过连接器访问内部和云数据源,这些云数据源包括AWS、Google Cloud、Azure和Sowflake 。Driverless AI支持基于CPU和GPU的系统,包括NVIDIA和IBM Power的最新系统。对于用户身份验证,Driverless AI支持LDAP和Kerberos以提供安全访问

企业支持与培训

H2O.ai以提供卓越的客户服务和支持而闻名。在2018年数据科学和机器学习平台Gartner魔力象限(Gartner魔力象限是监测和评估专业科技市场中公司的发展及定位的一种研究方法论和形象化工具)中,H2O.ai获得了客户服务和支持的最高分。 H2O.ai企业支持服务包括:7×24小时专家电子邮件和电话支持;H2O数据科学访问入口,MLI和算法专家服务;健康检查,运维 /产品咨询;在线和现场培训服务。

H2O Driverless AI的更多相关文章

  1. XAI/MLI 可解释机器学习系列1- 开源&paper汇总

    一直在关注可解释机器学习领域,因为确实在工作中有许多应用 模型检查,特征重要性是否符合预期和AUC一样重要 模型解释,比起虚无缥缈的模型指标,解释模型学到的规律更能说服业务方 样本解释,为什么这些用户 ...

  2. 媲美pandas的数据分析工具包Datatable

    1 前言 data.table 是 R 中一个非常通用和高性能的包,使用简单.方便而且速度快,在 R 语言社区非常受欢迎,每个月的下载量超过 40 万,有近 650 个 CRAN 和 Biocondu ...

  3. H2O.ai初步使用

    1.官网下载最新稳定版,https://www.h2o.ai/download/ ,如果点击下载无反应,请使用ie浏览器 2.解压h2o-3.18.0.10.zip到目录h2o-3.18.0.10 3 ...

  4. AI - H2O - 第一个示例

    1 - Iris数据集 Iris数据集是常用的机器学习分类实验数据集,特点是数据量很小,可以快速学习. 数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性. Sepal.Leng ...

  5. [GPU] Install H2O.ai

    一.前言 主页:https://www.h2o.ai/products/h2o4gpu/ GPU版本安装:h2oai/h2o4gpu 采用GPU,能否成为超越下面链接中实验的存在? [ML] LIBS ...

  6. AI - H2O - 安装与运行

    安装的要求 H2O的安装对操作系统.编程语言和浏览器有具体的要求. 详情请查看官方信息 下载H2O Downloading & Installing H2O Download 示例 - 在Ce ...

  7. 源码安装H2O Http 服务端程序到Ubuntu服务器

    首先安装全家桶 apt install -y build-essential zlib1g-dev libpcre3 libpcre3-dev unzip cmake libncurses5-dev ...

  8. ACCA AI来袭会议笔记

    ACCA AI来袭会议笔记 Technology in Accounting 调研报告: http://cn.accaglobal.com/news/professional_report.html ...

  9. AI佳作解读系列(三)——深度学习中的合成数据研究

    Below are some investigation resources for synthetic datasets: 1. Synthetic datasets vs. real images ...

随机推荐

  1. Apache2.4.34 + php 7.28 + MySQL8.0.12 安装及配置

    服务端的学习 Apache2.4.34 的安装及配置 1.基本安装 最新的 Apache 已经不提供 Windows 的安装版本,所以我们这里使用的是解压版 -下载地址:https://www.apa ...

  2. position+left+bottom+top+right

    今天才知道原来position加上上下左右可以控制的到div的宽度的 比如我现在有一个需要 这样一个需求 现在是红色部分50px 但是你可能不知道剩下的蓝色部分的高度是多少 蓝色部分要怎么填满剩余的高 ...

  3. HashMap源码阅读与解析

    目录结构 导入语 HashMap构造方法 put()方法解析 addEntry()方法解析 get()方法解析 remove()解析 HashMap如何进行遍历 一.导入语 HashMap是我们最常见 ...

  4. 并发编程(四)------并发quene

    在并发队列上JDK提供了两套实现,一个是以ConcurrentLinkedQueue为代表的高性能队列,一个是以BlockingQueue接口为代表的阻塞队列,无论哪种都继承自Queue接口! Con ...

  5. Win10 64位+VS2015+Opencv3.3.0安装配置

    Win10 64位+VS2015+Opencv3.3.0安装配置 1.我们首先下载VS2015.OpenCV3.3.0. 1.1 VS2015下载 在官网https://visualstudio.mi ...

  6. STM32 Startup**.s文件中使用的 __main C函数入口

    代码: ; Reset handler Reset_Handler PROC EXPORT Reset_Handler [WEAK] IMPORT SystemInit IMPORT __main L ...

  7. Learning notes | Data Analysis: 1.1 data evaluation

    | Data Evaluation | - Use Shift + Enter or Shift + Return to run the upper box so as to make it disp ...

  8. HyperLedger Fabric 1.4 区块链工作过程(2.3)

    区块链的工作过程分交易产生.交易广播.节点计算.获取记账权.记账权广播.接收区块.验证区块和完成记账七个过程. 1) 交易产生:用户向区块链发了一笔交易信息,将产生交易:2) 交易广播:当一笔新交易产 ...

  9. Linux下c语言实现myod

    首先根据od要输出16进制的功能,以及c语言中文件的打开读取等函数,编写了如下代码. #include<stdio.h> #define N 1000 int main() { int c ...

  10. 20155212Arrays和String测试_MySort

    Arrays和String单元测试 在IDEA中以TDD的方式对String类和Arrays类进行学习 测试相关方法的正常,错误和边界情况 String类 charAt split Arrays类 s ...