Vertica性能分析
Vertica的特点简单的说可以总结为:列存储、MPP架构、技术比较新。列存储本身带来了数据高度压缩的便利,MPP架构使得可以用相对廉价的PC级服务器横向扩展到较大规模(PB级),05年才问世使得它在引擎层面能用上近年来列式数据库方面较新的技术,如不可见连接(Invisible Join)等。
和Oracle那种一个库包治百病的方案不同,Vertica从设计之初就是面向分析型应用的。因此,它适合相对中低并发度,相对重载的分析查询场景。对于在Vertica上跑的每个查询SQL,它总是试图分配足够的系统资源,在尽量短的时间内完成,而不是追求同一时间能有较多的并发。一般而言,每节点的CPU core数就是合适的最大并发数设置。如果最大并发设置更高,根据系统的硬件和参数配置,很多查询分配的资源可能不足,有的查询甚至进入队列等待,从而导致每个SQL的平均查询时间上升。就我们测试的经验,在系统负载达到一定程度后,增加并发度,系统的查询吞吐量(单位时间内能跑完的SQL个数)基本持平甚至会下降。这个特点尤其要注意。
Vertica的SQL语法和SQL92标准兼容,在Oracle上的SQL除了一些oracle特有函数之外,很少需要修改就可以直接在Vertica上运行。具体谈到到一个SQL的性能,都离不开执行计划的分析。
有两种方式查看执行计划:
1、MC(management console)图形界面
2、查询系统视图:Vertica提供了一系列数据字典和视图,对于SQL性能分析最重要的有两个。QUERY_PLAN_PROFILES提供了SQL运行时实际执行计划的信息,execution_engine_profiles则进一步提供了SQL执行时每一步每个节点具体的资源消耗信息,以便精确判断瓶颈所在。有这两个视图的数据,基本上可以完成所有的SQL级性能分析。
如何获取特定SQL的执行计划:
在Oracle中,一般根据SQL_ID和Plan hash value可以唯一确定一个SQL的执行计划。在Vertica中,类似的可以通过transaction_id和statement_id两个参数唯一确定一个执行计划。手工测试时通常statement_id默认是1,所以上述脚本在使用时,注意抓到要分析SQL的transaction_id即可。
因为vertica会针对每一列选择不同的压缩算法进行压缩,在SQL执行时不同数据类型的执行效率也有很大差异。所以数据类型的选择对性能影响会相对Oracle更加明显。
就Vertica我们的实践而言,数据类型的选择可以简单总结为下面几点:
1、 能用整型就不用浮点型;
2、 长度尽量短;
3、 能固定长度就不要变长(结合2);
根据测试验证,我们某个案例中将事实表KEY/ID类型字段从浮点型改为整数,将大量金额字段的数据进度从(38,10)改为(24,4),最后查询性能从6秒提升到4秒,提升了50%
Vertica有一个特别的概念projection,具体的定义和特点介绍此处不再赘述,有Oracle经验的同学可以简单的把它理解为类似物化视图的功能(当然本质有很大不同)。
Vertica性能分析的更多相关文章
- 如何进行python性能分析?
在分析python代码性能瓶颈,但又不想修改源代码的时候,ipython shell以及第三方库提供了很多扩展工具,可以不用在代码里面加上统计性能的装饰器,也能很方便直观的分析代码性能.下面以我自己实 ...
- SQL Server-聚焦IN VS EXISTS VS JOIN性能分析(十九)
前言 本节我们开始讲讲这一系列性能比较的终极篇IN VS EXISTS VS JOIN的性能分析,前面系列有人一直在说场景不够,这里我们结合查询索引列.非索引列.查询小表.查询大表来综合分析,简短的内 ...
- SQL Server-聚焦NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL性能分析(十八)
前言 本节我们来综合比较NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL的性能,简短的内容,深入的理解,Always to review the basics. ...
- SQL Server-聚焦LEFT JOIN...IS NULL AND NOT EXISTS性能分析(十七)
前言 本节我们来分析LEFT JOIN和NOT EXISTS,简短的内容,深入的理解,Always to review the basics. LEFT JOIN...IS NULL和NOT EXIS ...
- SQL Server-聚焦EXISTS AND IN性能分析(十六)
前言 前面我们学习了NOT EXISTS和NOT IN的比较,当然少不了EXISTS和IN的比较,所以本节我们来学习EXISTS和IN的比较,简短的内容,深入的理解,Always to review ...
- SQL Server-聚焦NOT EXISTS AND NOT IN性能分析(十五)
前言 上一节我们分析了INNER JOIN和IN,对于不同场景其性能是不一样的,本节我们接着分析NOT EXISTS和NOT IN,简短的内容,深入的理解,Always to review the b ...
- SQL Server-聚焦INNER JOIN AND IN性能分析(十四)
前言 本节我们来讲讲联接综合知识,我们在大多教程或理论书上都在讲用哪好,哪个性能不如哪个的性能,但是真正讲到问题的实质却不是太多,所以才有了本系列每一篇的篇幅不是太多,但是肯定是我用心去查找许多资料而 ...
- Java 性能分析工具 , 第 3 部分: Java Mission Control
引言 本文为 Java 性能分析工具系列文章第三篇,这里将介绍如何使用 Java 任务控制器 Java Mission Control 深入分析 Java 应用程序的性能,为程序开发人员在使用 Jav ...
- Java 性能分析工具 , 第 2 部分:Java 内置监控工具
引言 本文为 Java 性能分析工具系列文章第二篇,第一篇:操作系统工具.在本文中将介绍如何使用 Java 内置监控工具更加深入的了解 Java 应用程序和 JVM 本身.在 JDK 中有许多内置的工 ...
随机推荐
- 你不得不知的Golang线程模型 [转载]
原著:翟陆续(加多) 资深Java , 著Java并发编程之美 一.前言 本节我们来探讨Go的线程模型,首先我们先来回顾下常见的三种线程模型,然后在介绍Go中独特的线程模型. 二.三种线程模型 线程的 ...
- [CrackMe]160个CrackMe之001
吾爱破解专题汇总:[反汇编练习]160个CrackME索引目录1~160建议收藏备用 一.Serial/Name 之 暴力破解 1. 熟悉界面:很常规的一个界面,输入完账号密码之后会进行验证. 2. ...
- Elasticsearch(ES) 创建索引
欢迎关注笔者的公众号: 小哈学Java, 每日推送 Java 领域干货文章,关注即免费无套路附送 100G 海量学习.面试资源哟!! 个人网站: https://www.exception.site/ ...
- VS2013(InstallShield2015LimitedEdition)打包程序详解
VS2012没有自带打包工具,所以要先下载并安装一个打包工具.我采用微软提供的打包工具: InstallShield2015LimitedEdition.下载地址:https://msdn.micr ...
- C#网页 截图
using System.IO; using System.Drawing; using System.Drawing.Imaging; using System.Threading; using S ...
- 实用的生成二维码API
推荐一个生成二维码的API网站: 中文 http://www.topscan.com 英文 https://api.qrserver.com/v1/create-qr-code/?size=150x1 ...
- jQuery的animate
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...
- mysql Waiting for table flush
应用突然被hang住了,tomcat日志报错,所有涉及到数据库的操作都报错,卡死. show processlist 查看到大量的:Waiting for table flush 应该是 进行了 dd ...
- Redis 使用过程中遇到的具体问题
1.缓存雪崩和缓存穿透问题 1.1缓存雪崩 简介:缓存同一时间大面积的失效,所以,后面的请求都会落到数据库上,造成数据库短时间内承受大量请求而崩掉. 解决办法: 事前:尽量保证整个 redis 集 ...
- 编译安装redis 3.2.9 make test 时报错
默认监听端口:6379(可以创建多个端口的配置文件) 源码安装: $ yum install tcl $ wget http://download.redis.io/releases/redis-3. ...