一.presto动态化概述 近年来,基于hadoop的sql框架层出不穷,presto也是其中的一员.从2012年发展至今,依然保持年轻的活力(版本迭代依然很快),presto的相关介绍,我们就不赘述了,相信看官多对presto有或多或少的了解,详细的一些说明可以看官网(https://prestodb.io)的说明. presto自身功能和思想富有先进性,虽然由于是内存计算,稳定性方面还有很大提升空间,但整体依然在adhoc方面有很好的竞争力,我们本次介绍针对我们团队对于presto部分应用个…
    出处:[http://www.cnblogs.com/dennisit/p/4133131.html] ,防楼主删博,故保留一份! elasticsearch用于构建高可用和可扩展的系统.扩展的方式可以是购买更好的服务器(纵向扩展)或者购买更多的服务器(横向扩展),Elasticsearch能从更强大的硬件中获得更好的性能,但是纵向扩展也有一定的局限性.真正的扩展应该是横向的,它通过增加节点来传播负载和增加可靠性.对于大多数数据库而言,横向扩展意味着你的程序将做非常大的改动来利用这些新添…
DOM 自身存在很多类型,比如 Element 类型(元素节点)再比如 Text 类型(文本节点).DOM 还提供了一些扩展功能. 一.Node类型 Node 接口是 DOM1 级就定义了,Node 接口定义了 12 个数值常量以表示每个节点的类型值.IE6,7,8不支持,其他所有浏览器都可以访问这个类型. 虽然这里介绍了 12 种节点对象的属性,用的多的其实也就几个而已. <script> window.onload =function(){ alert(Node); //火狐打印出函数本身…
安装和配置计算节点这个章节描述如何在计算节点上安装和配置计算服务. 计算服务支持几种不同的 hypervisors.为了简单起见,这个配置在计算节点上使用 :KVM <kernel-based VM (KVM)>`扩展的:QEMU <Quick EMUlator (QEMU)>`作为hypervisor,支持虚拟机的硬件加速.在旧的硬件上,这个配置使用通用的QEMU作为hypervisor.你可以根据这些说明进行细微的调整,使用额外的计算节点来横向扩展你的环境. 节点配置信息说明:…
Elasticsearch 是一个兼有搜索引擎和NoSQL数据库功能的开源系统,基于Java/Lucene构建,可以用于全文搜索,结构化搜索以及近实时分析.可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架. 说明: Lucene:只是一个框架,要充分利用它的功能,需要使用JAVA,并且在程序中集成Lucene,学习成本高,Lucene确实非常复杂. Elasticsearch 是 面向文档型数据库,这意味着它存储的是整个对象或者 文档,它不但会存储它们,还会为他们建立索引,这样你就…
扩容设计 扩容的单元 一个分片即一个 Lucene 索引 ,一个 Elasticsearch 索引即一系列分片的集合 一个分片即为 扩容的单元 . 一个最小的索引拥有一个分片. 一个只有一个分片的索引无扩容因子 - 如何判断一个请求过来,我的信息在哪个分片上面 shard = hash(routing) % number_of_primary_shards routing 大致是指文档的id 分片预分配 一个分片存在于单个节点, 但一个节点可以持有多个分片 一个拥有两个分片的索引可以利用第二个节…
本章内容介绍下 Hadoop 自带的分布式文件系统,HDFS 即 Hadoop Distributed Filesystem.HDFS 能够存储超大文件,可以部署在廉价的服务器上,适合一次写入多次读取的场景.但 HDFS 不适合低延迟,存储大量小文件以及修改文件内容的场景.HDFS 应用比较广泛,如:MR任务.Spark任务.Hive 数据仓库以及 Hbase 数据库,它们的底层存储都可以基于 HDFS .本章将介绍 HDFS 集群的架构设计以及相关的重要概念. HDFS的设计以及概念 HDFS…
<Windows Azure Platform 系列文章目录> 在之前的项目中遇到了客户使用SQL数据仓库的场景,在这里记录一下 1.什么是SQL 数据库仓库 (SQL DW) SQL DW是云端的企业级数据仓库,用来处理TB,甚至PB级别的关系型数据库的OLAP(联机分析处理)场景,主要用来做数据分析和查询 2.什么是OLAP OLAP (Online Analysis Processing)联机分析处理.表示从多维数据集的多维结构来对数据进行聚合处理 3.OLAP和OLTP的区别 OLTP…
序言 ES数据架构的主要概念(与关系数据库Mysql对比) 集群(cluster) 集群,一个ES集群由一个或多个节点(Node)组成,每个集群都有一个cluster name作为标识.一下是我们的4节点集群. 节点(node) 节点,一个ES实例就是一个node,一个机器可以有多个实例,所以并不能说一台机器就是一个node,大多数情况下每个node运行在一个独立的环境或虚拟机上. 索引(index) 索引,即一系列documents的集合. 类型(type) 分片(shard) 一个拥有两个主…
目录 1. 什么是Zookeeper 2. Zookeeper集群角色 3. Zookeeper的数据模型 3.1 Znode的类型 3.2 Znode的结构 4. Zookeeper的事件监听机制 5. Zookeeper如何保证分布式数据一致性--ZAB协议 5.1 事务请求的处理流程 5.2 Leader服务器的选举流程 6. Zookeeper如何进行服务器故障的容错 7. 参考资料 1. 什么是Zookeeper Zookeeper是大数据生态圈中的重要组件,如果你做过相关开发的话,应…