前言:
<<line>> 表明在vertica 8.0文档中的title
 
正文:
1-支持平台
1.1-操作系统
<<Vertica Server and Vertica Management Console>>
When there are multiple minor versions supported for a major operating system release, Hewlett Packard Enterprise recommends that you run Vertica on the latest minor version listed in the supported versions list. For example, if you run Vertica on a Red Hat Enterprise Linux 6.x release, Hewlett Packard Enterprise recommends you upgrade to or be running the latest supported RHEL 6.x release, which is 6.8.
官方推荐rhel6.8或centos6.8版本
 
1.2- 文件系统
Vertica Analytic Database Enterprise Edition has been tested on all supported Linux platforms running the ext4 file system. For the Vertica Analytic Database I/O profile, the ext4 file system is considerably faster than ext3.
官方推荐ext4方式,不要使用LVM
 
1.3-hadoop支持
<<Vertica Integrations for Hadoop>>
支持CDH 5.6-5.8,其中5.6逐渐不再支持
 
1.4-kafka支持
<<Vertica Integration for Apache Kafka>>
支持Kafka 0.8.x-0.9,其中0.8.x逐渐不再支持
 
1.5-java/R支持
jdk 1.6-1.8
R语言3.0
 
2-新特性-
2.1-机器学习的资源池单独设置
<<New Resource Pool for BLOBDATA>>
blobdata资源池的设置
 
2.2-异常值检测
outliner过程
<<DETECT_OUTLIERS>>
基于标准差(待定是不是标准差)来筛选数据
If data point > ( value * STDDEV( data ) ) then data point is an outlier.
dbadmin=> SELECT * FROM baseball_roster;
id | last_name | hr | avg
----+-----------+--------+--------
1 | Polo | 7 | 0.233
2 | Gloss | 45 | 0.17
3 | Gus | 12 | 0.345
4 | Gee | 1 | 0.125
5 | Laus | 3 | 0.095
6 | Hilltop | 16 | 0.222
7 | Wicker | 78 | 0.333
8 | Scooter | 0 | 0.121
9 | Hank | 999999 | 0.8888
10 | Popup | 35 | 0.378
(10 rows)
 
dbadmin=> SELECT * FROM baseball_outliers;
id | last_name | hr | avg
----+-----------+--------+--------
7 | Wicker | 78 | 0.333
9 | Hank | 999999 | 0.8888
(2 rows)
 
2.3-机器学习相关
2.3.1-期初导入
<<Downloading the Machine Learning Example Data>>
yum install git
vsql -d dbname -f load_ml_data.sql
 
2.3.2-训练模型
<<NAIVE_BAYES>>
#训练基础表,党派人士的投票倾向
select * from public.house84_train;
#训练model//训练基础表//要预测哪一列//基于那些数据来预测//排除非数据列
SELECT NAIVE_BAYES
('naive_house84_model', 'house84_train', 'party', '*','--exclude_columns="party, id"');
 
2.3.3-验证模型
<<Classifying Data Using Naive Bayes>>
SELECT SUMMARIZE_MODEL('naive_house84_model', 'dbadmin');
基于模型来检验是民主党还是共和党
CREATE TABLE predicted_party_naive
AS SELECT party,
PREDICT_NAIVE_BAYES (vote1, vote2, vote3, vote4, vote5,
vote6, vote7, vote8, vote9, vote10, vote11, vote12, vote13, vote14,vote15, vote16
USING PARAMETERS model_name = 'naive_house84_model',owner = 'dbadmin',type = 'response') AS Predicted_Party
FROM house84_test;
 
 
每个预测的可能性百分比
SELECT PREDICT_NAIVE_BAYES_CLASSES (id, vote1, vote2, vote3, vote4, vote5,
vote6, vote7, vote8, vote9, vote10,
vote11, vote12, vote13, vote14,
vote15, vote16
USING PARAMETERS model_name = 'naive_house84_model',
owner = 'dbadmin',
key_columns = 'id', exclude_columns = 'id',
classes = 'democrat, republican')
OVER() FROM house84_test;
 
基于训练集的前三个vote,来预测党派
SELECT party, PREDICT_NAIVE_BAYES (vote1, vote2, vote3
USING PARAMETERS model_name = 'naive_house84_model',
owner = 'dbadmin',
type = 'response') AS Predicted_Party
FROM house84_test;
 
 
 
 

vertica 8.0 新特性的更多相关文章

  1. 浅谈Tuple之C#4.0新特性那些事儿你还记得多少?

    来源:微信公众号CodeL 今天给大家分享的内容基于前几天收到的一条留言信息,留言内容是这样的: 看了这位网友的留言相信有不少刚接触开发的童鞋们也会有同样的困惑,除了用新建类作为桥梁之外还有什么好的办 ...

  2. Java基础和JDK5.0新特性

    Java基础 JDK5.0新特性 PS: JDK:Java Development KitsJRE: Java Runtime EvironmentJRE = JVM + ClassLibary JV ...

  3. Visual Studio 2015速递(1)——C#6.0新特性怎么用

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  4. atitit.Servlet2.5 Servlet 3.0 新特性 jsp2.0 jsp2.1 jsp2.2新特性

    atitit.Servlet2.5 Servlet 3.0 新特性 jsp2.0 jsp2.1 jsp2.2新特性   1.1. Servlet和JSP规范版本对应关系:1 1.2. Servlet2 ...

  5. 背水一战 Windows 10 (1) - C# 6.0 新特性

    [源码下载] 背水一战 Windows 10 (1) - C# 6.0 新特性 作者:webabcd 介绍背水一战 Windows 10 之 C# 6.0 新特性 介绍 C# 6.0 的新特性 示例1 ...

  6. C# 7.0 新特性2: 本地方法

    本文参考Roslyn项目中的Issue:#259. 1. C# 7.0 新特性1: 基于Tuple的“多”返回值方法 2. C# 7.0 新特性2: 本地方法 3. C# 7.0 新特性3: 模式匹配 ...

  7. C# 7.0 新特性1: 基于Tuple的“多”返回值方法

    本文基于Roslyn项目中的Issue:#347 展开讨论. 1. C# 7.0 新特性1: 基于Tuple的“多”返回值方法 2. C# 7.0 新特性2: 本地方法 3. C# 7.0 新特性3: ...

  8. C# 7.0 新特性3: 模式匹配

    本文参考Roslyn项目Issue:#206,及Docs:#patterns. 1. C# 7.0 新特性1: 基于Tuple的“多”返回值方法 2. C# 7.0 新特性2: 本地方法 3. C# ...

  9. C# 7.0 新特性4: 返回引用

    本文参考Roslyn项目中的Issue:#118. 1. C# 7.0 新特性1: 基于Tuple的“多”返回值方法 2. C# 7.0 新特性2: 本地方法 3. C# 7.0 新特性3: 模式匹配 ...

随机推荐

  1. D3树状图给指定特性的边特别显示颜色

    D3作为前端图形显示的利器,功能之强,对底层技术细节要求相对比较多. 有一点,就是要理解其基本的数据和节点的匹配规则架构,即enter,update和exit原理,我前面的D3基础篇中有介绍过,不明白 ...

  2. JavaScript中常见的数组操作函数及用法

    JavaScript中常见的数组操作函数及用法 昨天写了个帖子,汇总了下常见的JavaScript中的字符串操作函数及用法.今天正好有时间,也去把JavaScript中常见的数组操作函数及用法总结一下 ...

  3. [zz]利用碎片时间健身

    利用碎片时间健身(上) http://v.163.com/zixun/V96957QH6/VBSQ4D861.html#from=zixunplay_recommended 利用碎片时间健身(下) h ...

  4. Lab_3_SysOps_Storage_Linux_v2.5

    System Operations - Lab 3: Managing Storage in AWS (Linux) - 2.5 =================================== ...

  5. 一款好用且免费的语句分析工具Plan Explorer

    在调优过程中的查询语句优化阶段,分析语句的执行计划是必经之路,一款好的执行计划分析工具确实可以帮助我们事半功倍 小贴士:Plan Explorer是将Plan Explorer 专业版与免费版整合在一 ...

  6. JUnit 简介

    一.简介 JUnit是一个开源的java单元测试框架.在1997年,由 Erich Gamma 和 Kent Beck 开发完成.这两个牛人中 Erich Gamma 是 GOF 之一:Kent Be ...

  7. mysql删造成表死锁研究

    现在互联网公司对于代码的管理越来越规范,一般都会有3个环境:开发环境,测试环境,正式环境.在开发环境进行开发,开发完成后将代码提交到测试环境进行测试,测试完毕后上线到正式环境. 今天在正式环境上遇到一 ...

  8. 51nod 1180 方格射击游戏

    M*N的方格矩阵,一个人在左下角格子的中心,除他所站位置外,其他格子的中心都有一个敌人,他一次可发射一枚子弹干掉一条直线上的所有敌人,问至少要发射多少子弹才能干掉所有敌人. Input 输入2个数m, ...

  9. Gradle脚本基础全攻略

    http://blog.csdn.net/yanbober/article/details/49314255

  10. Stanford NLP 学习笔记2:文本处理基础(text processing)

    I. 正则表达式(regular expression) 正则表达式是专门处理文本字符串的正式语言(这个是基础中的基础,就不再详细叙述,不了解的可以看这里). ^(在字符前): 负选择,匹配除括号以外 ...