http://www.meritdata.com.cn/article/90

PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。

Pluto平台设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准)。Pluto强大的数据挖掘功能将复杂的统计方法和机器学习技术应用到业务数据当中,帮助客户揭示隐藏在业务系统和企业资源计划、结构数据库和普通文件等信息中的模式和趋势,让客户始终站在行业发展的前端。

Pluto具有完备的数据准备、数据处理、模型构建、模型评估、模型管理和结果展现功能,具有系统性、开放性、流程性和服务性等特征。可以帮助企业从业务数据中挖掘规律,并对关键问题做出预测,并可以应用模型部署到业务流程中,提高决策效率和执行力。目前已经成功应用于智能电网、制造业、航空航天、政府及公共服务业、电信业务和证券金融等众多领域。

二、产品特点

Pluto为多种商业问题和研究问题提供了基本的分析功能,架构如下图示:

Pluto以数据挖掘过程为基础,提供对数据文件、数据库等数据源的支持。数据挖掘平台通过数据的清理准备工作,用科学的数据挖掘方法建立模型,最终以图形或者表格等可视化的方式将数据挖掘的结果展示给用户,并支持模型参数调优。业务模型可发布为多种服务,供外部系统集成调用。

1.平台框架

平台框架是Pluto数据挖掘平台的基础运行环境,主要包括:算法动态注册、消息通知、数据传输、数据存储、数据缓存等功能。
1)算法动态注册

算法动态注册基于OSGI机制,可以在软件不停止运行、不重新对源代码进行编译的状态下,将新增算法动态注册到平台中,具有良好的扩展性与开放性。
2)大数据支撑

一方面平台数据加载与处理采用内存映射文件机制,另一方面平台算法利用增量学习和优化内存结构的矩阵模型,不仅增强对大数据的处理规模,而且提高了数据挖掘算法的处理效率。
3)数据缓存

平台数据预处理节点和模型节点都实现了数据处理结果的缓存功能,从而可以根据需要指定流程从最后一个有缓存数据的节点开始运行,极大的提高了数据挖掘流程的运行效率。
2.数据源

Pluto数据源支持文件和数据库,文件支持文本文件(*.txt,*.csv)和Excel文件(*.xls,*.xlsx),数据库支持oracle(9i、10g、11g)、SqlServler(2005、2008)、DB2、MySql等常用类型,同时支持列式数据库的接入。
3.数据预处理

数据预处理主要实现数据的清理准备工作,包括样本处理和属性操作。样本处理包括条件抽样、简单抽样、平衡、汇总和样本排序等功能,属性操作包括指定因变量、属性选择、属性变换、离散化、数据集拆分、分箱和数据降维等功能。
4.领先的数据挖掘算法

Pluto包含经典算法20个和高效的自主算法10个。

其中国内独有的L1/2稀疏迭代算法、视觉聚类算法分别在长流程制造工艺分析和图形处理方面具有特殊优势。用户可以从多种算法中选择来进行预测、聚类、关联、分类等操作。Pluto算法支持主流云计算技术框架(Hadoop、Enomalism、Euclyptus等),实现海量数据的分析与挖掘。

5.模型构建与评估

模型构建是指训练并得到数据挖掘模型,模型评估帮助用户对数据挖掘模型的结果进行准确度分析,用户可根据模型评估结果的满意度对模型参数进行调优。
6.丰富的数据可视化

平台提供了10余种图形化技术和输出报告,帮助用户理解数据间的关键性信息,并指导用户以最便捷的途径找到问题的最终解决办法。
7.模型流程发布

模型流程发布是将数据挖掘模型流程发布为服务,包括Webservice服务和JMS服务,支撑外部系统的数据挖掘分析功能。同时,平台支持模型流程jar包导出,提供Java Jar API便于将模型流程直接集成到外部系统的开发环境。
8.模型流程服务管理

模型流程服务管理用于对平台发布的数据挖掘模型流程服务进行管理,包括服务的权限管理、版本管理和预测评估任务管理等功能。
9.服务访问接口

第三方(或外部)系统可以通过调用Webservice服务、JMS服务或直接调用Java Jar API进行数据挖掘分析功能的构建。

PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。的更多相关文章

  1. 从开发一款基于Vue技术栈的全栈热重载生产环境脚手架,我学到了什么

    浏览文章前 这一期,我分享给大家三点看源码的小技巧,这也是从别的大佬那总结的. 被反复使用的代码 这样的代码是一个软件的重点函数,一个大神的写法有很多精华值得学习. 穿越时间的代码 如果一段代码10年 ...

  2. 一款基于Zigbee技术的智慧鱼塘系统研究与设计

    在现代鱼塘养鱼中,主要困扰渔农的就是养殖成本问题.而鱼塘养殖成本最高的就是养殖的人工费,喂养的饲料费和鱼塘中高达几千瓦增氧机的消耗的电费.实现鱼塘自动化养殖将会很好地解决上述问题,大大提高渔农的经济效 ...

  3. 华为参与《基于5G技术的医院网络建设标准》的制定

    [摘要] 5G 千兆网承载五地远程会诊,现场完成三例复杂性疑难重症远程病例讨论 [中国,北京,2019年9月4日] 金秋之际,在国家卫生健康委指导下,由中日友好医院•国家远程医疗与互联网医学中心•国家 ...

  4. 基于ETL技术的数字化校园共享数据中心设计

    摘要:数据的抽取.转换与加载(ETL)是数据整合的核心过程.在分析高校信息化建设现状基础上,以建立数字化校园.整合数据资源.实现数据共享为目标,提出以ETL为基础建立共享数据中心实现数据整合的方案.介 ...

  5. angularJS1笔记-(18)-$http及用angular实现JSONP跨域访问过程

    官网上的解释为: The $http service is a core AngularJS service that facilitates communication with the remot ...

  6. padding标准盒模型和怪异盒子模型

    我们都知道padding是为块级元素设置内边距 但是在使用过程中,我们却会遇到一些问题.padding的标准盒模型和怪异盒模型 padding盒子模型 我们通过demo来讲这个问题,用文字干讲第一没意 ...

  7. Kubernetes——基于容器技术的分布式架构领先方案,它的目标是管理跨多个主机的容器,提供基本的部署,维护以及运用伸缩

    1.Kubernetes介绍 1.1 简介 Kubernetes是什么?首先,它是一个全新的基于容器技术的分布式架构领先方案.其次,它是一个开放的开发平台.最后,它是一个完备的分布式系统支撑平台.Ku ...

  8. 标准盒模型与IE盒模型之间的转换

    首先上图,这两张很明显可以看出IE盒模型和标准盒模型之间的差别. 当然今天不是去细细追究两种模型具体是怎么去计算布局的,那个很多文章已经已经有过了,不再重复.以前刚开始学习盒模型的时候,就学到的是IE ...

  9. w3c标准盒模型与IE传统模型的区别

    一.盒子模型(box model) 在HTML文档中的每个元素被描绘为矩形盒子.确定其大小,属性——比如颜色.背景.边框,及其位置是渲染引擎的目标. CSS下这些矩形盒子由标准盒模型描述.这个模型描述 ...

随机推荐

  1. Lombock原理

    说道Lombok,可能会鲜为人知.但是在实际的开发中,它起到了很大的作用,话不多说,直入正题: 一.Lombok是什么 现在看一下Lombok官方对其进行的解释:Lombok官网:https://pr ...

  2. Java实现数字大写转换

    需求如下:用json读取后台工时信息,比如23.5小时,需要通过编码将其转换为贰拾叁点伍 比如23.23之前有对Stringl类型强转为Double在转为整型,发生了精度丢失,后来想想对小数点进行分割 ...

  3. HZOI20190803 B题

    题目:https://www.cnblogs.com/Juve/articles/11295333.html 话说这题方法挺多 40分:暴力 65:莫队,你会T得飞起 我考场上没打出带修莫队,没有修改 ...

  4. Tuxera ntfs软件如何删除干净

    sudo /Library/Filesystems/fusefs_txantfs.fs/Contents/Resources/Support/uninstall-package.sh

  5. jeecms各种标签类(大部分,并没有包含一些其他的如text_cut html_cut之类)

    软件包 comjeecms.cms.action.directive 类摘要 ChannelDirective 栏目对象标签 ChannelListDirective 栏目列表标签 ChannelPa ...

  6. Linux TC的ifb原理以及ingress流控-转

    原文:http://www.xuebuyuan.com/2961303.html 首先贴上Linux内核的ifb.c的文件头注释:     The purpose of this driver is ...

  7. GC Roots的几种对象

    在java语言里,可作为GC Roots的对象包括下面几种: >虚拟机栈(栈帧中的本地变量表)中的引用的对象: >方法区中类静态属性引用的对象: >方法区中常量引用的对象: > ...

  8. shell 第一篇

    1. 查看当前linux 支持的shell 类型 [root@nfs01 ~]# cat /etc/shells /bin/sh /bin/bash /sbin/nologin /bin/dash / ...

  9. Connection reset问题,INFO: I/O exception (java.net.SocketException) caught when processing reques

    困扰我多年的Connection reset问题 第一次出现:是thrift的python client去请求server,发现偶尔出现这个问题 第二次:接入第三方的api,去请求数据时,发现一个接入 ...

  10. 【JZOJ5233】【GDOI模拟8.5】概率博弈 树形dp+期望

    题面 小A和小B在玩游戏.这个游戏是这样的: 有一棵n个点的以1为根的有根树,叶子有权值.假设有m个叶子,那么树上每个叶子的权值序列就是一个1->m 的排列. 一开始在1号点有一颗棋子.两人轮流 ...