Cassandra学习六一些知识点

http://www.flyml.net/2016/09/08/cassandra-tutorial-java-api-example/

Cassandra对查询的支持很弱，只支持主键列及索引列的查询，而且主键列还有各种限制，不过查询弱归弱，但它还是支持索引和排序的。

cassandra:

　　　　索引列支持 like
　　　　只有主键支持 group by
　　　　不支持 or, 但是支持 and

select * from books where subject like 'Pro%'

CREATE CUSTOM INDEX employee_firstname_idx ON
books (subject) USING
'org.apache.cassandra.index.sasi.SASIIndex' WITH
OPTIONS = {'analyzer_class': 'org.apache.cassandra.index.sasi.analyzer.StandardAnalyzer', 'case_sensitive': 'false'};

Partition Key ：决定了数据在Cassandra各个节点的是如何分区的。
Clustering Key ：用于在各个分区内的排序。
Primary Key ：主键，决定数据行的唯一性
Composite Key ：只是一个多字段组合的概念

在实际的使用过程中,cassandra的数据查询有很多不同于关系型数据库的地方，
如果你总是用关系型数据库的思维去考虑cassandra的问题的话，往往会掉进坑里。
cassandra的CQL写法并没有像你想象中的随心所欲，因为究其本质，
它的数据集是以key-value的形式存放，所以在查询时会有很多限制。

总结：

cassandra的查询必须在主键列上，或者查询的字段有二级索引。
对于（A，B）形式的主键，假如查询条件不带分区键A，则查询语句需要开启allow filtering。
对于（（A，B）,C,D）形式的主键，可以认为是第2点的变种。A，B必须同时出现在查询条件中（A和B合在一起决定分区）,且C,D不可以跳跃，像where A and B and D的查询是非法的。
以上查询不考虑范围查询的情况。
所以因为第三点的关系，parition key字段过多会对以后的查询造成很大困扰，在建表的时候首先一定要考虑好数据模型，以免后期掉坑。
此外假如与spark集成的话，可以在一定程度上规避掉上面非法查询的问题，通过sparksql可以近似实现关系型数据库sql的查询，而不用考虑查询中一定要带上所有partition key字段

PRIMARY KEY(key_part_one, key_part_two)
PRIMARY KEY((k_part_one,k_part_two), k_clust_one, k_clust_two, k_clust_three)
Partition Key : Cassandra会对partition key 做一个hash计算，并自己决定将这一条记录放在哪个node；
Clustering Key : 主要用于进行Range Query. 并且使用的时候需要按照建表顺序进行提供信息；
Cassandra 整体数据可以理解成一个巨大的嵌套的Map。只能按顺序一层一层的深入，不能跳过中间某一层~

如果只根据key_part_two 来查询呢？
A: 默认不允许：会触发数据过滤（需要扫描的数据比较多）
如果一定要执行：在cql 之中增加ALLOW FILTERING
select * from stackoverflow where key_part_two = 9 ALLOW FILTERING;

Cassandra之中的存储，是2-level nested Map
Partition Key –> Custering Key –> Data
partition key: eq and in
clustering key: < <= = >= > in

二级索引的原理：
Cassandra之中的索引的实现相对MySQL的索引来说就要简单粗暴很多了。他实际上是自动偷偷新创建了一张表格，
同时将原始表格之中的索引字段作为新索引表的Primary Key！并且存储的值为原始数据的Primary Key

注意：一个CF可以包含多个Column，并且每一行可以包含的Column的范围不要求完全一致。类似一个稀疏矩阵；
。Cassandra的发展很快，但是基础的数据模型并没有本质改变。从2007年诞生到现在（2016年），仍然可以使用下面的一句话概括：
Map<RowKey, SortedMap<ColumnKey, ColumnValue>>
首先Map结构，通过key来进行查询速度会非常快。再加上内嵌的SortedMap，可以进行顺序查找，速度也很快。当然，如何快速的生成Key等就是另外一个topic了

Cassandra学习六一些知识点的更多相关文章

阅读《LEARNING HARD C#学习笔记》知识点总结与摘要三
最近工作较忙,手上有几个项目等着我独立开发设计,所以平时工作日的时候没有太多时间,下班累了就不想动,也就周末有点时间,今天我花了一个下午的时间来继续总结与整理书中要点,在整理的过程中,发现了书中的一些 ...
大数据 -- kafka学习笔记：知识点整理（部分转载）
一为什么需要消息系统 1.解耦允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多 ...
第四十六个知识点在Sigma协议中，正确性，公正性和零知识性意味着什么
第四十六个知识点在Sigma协议中,正确性,公正性和零知识性意味着什么 Sigma协议 Sigma协议是Alice想要向Bob证明一些东西的协议(Alice知道一些秘密).他们有下面的一般范式:Al ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要系列文章索引
从发表第一篇文章到最后一篇文章,时间间隔有整整一个月,虽只有5篇文章,但每一篇文章都是我吸收<LEARNING HARD C#学习笔记>这本书的内容要点及网上各位大牛们的经验,没有半点废话 ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要二
今天继续分享我的阅读<LEARNING HARD C#学习笔记>知识点总结与摘要二,仍然是基础知识,但可温故而知新. 七．面向对象三大基本特性: 封装:把客观事物封装成类,并隐藏类的内部 ...
Hbase深入学习(六) Java操作HBase
Hbase深入学习(六) ―― Java操作HBase 本文讲述如何用hbase shell命令和hbase java api对hbase服务器进行操作. 先看以下读取一行记录hbase是如何进行工作 ...
TweenMax动画库学习(六)
目录 TweenMax动画库学习(一) TweenMax动画库学习(二) TweenMax动画库学习(三) Tw ...
SVG 学习<六> SVG的transform
目录 SVG 学习<一>基础图形及线段 SVG 学习<二>进阶 SVG世界,视野,视窗 stroke属性 svg分组 SVG 学习<三>渐变 SVG 学习<四 ...
C#多线程学习(六) 互斥对象
如何控制好多个线程相互之间的联系,不产生冲突和重复,这需要用到互斥对象,即:System.Threading 命名空间中的 Mutex 类. 我们可以把Mutex看作一个出租车,乘客看作线程.乘客首先 ...

随机推荐

websocket之django简单使用
WebSocket protocol: WebSocket protocol 是HTML5一种新的协议.它是实现了浏览器与服务器全双工通信(full-duplex).HTML5定义了WebSocket ...
CSLA验证规则总结
CSLA业务规则验证规则所在空间: Csla.Rules 基类 BusinessBase 的属性 BusinessRules 中记录了业务类的验证规则验证规格的写法 private class ...
安装Charles报错
去年用的是charles4.1.2版本,今年这个版本的安装包始终安装报错,不管公司电脑还是自己电脑........ 我的解决方案很Lower的.......... 登录Charles官网:https: ...
django model_fields_validators 前端页面编辑自定义验证
# model_field_validators.py import re from django.core.exceptions import ValidationError from django ...
ndk+opencv安装＋各种错误分析（新版安装，编译不需要Cygwin 和Sequoyah了）
鼓捣了两三天,终于成功算跑通了一个简单的程序.下面说说具体的安装: 因为从同学那里拷过来的eclipse 就有adt cdt 的插件.所以这两个就不用再安装了.(需要的话自己安装) 具体说下安装过程: ...
LeetCode OJ：Palindrome Linked List（回文链表判断）
Given a singly linked list, determine if it is a palindrome. Follow up:Could you do it in O(n) time ...
Head First HTML与CSS 学习笔记
1.使用<a>元素创建一个超文本链接,链接到另一个Web页面.<a>元素的内容会成为Web页面中可单击的文本.href属性告诉浏览器链接的目标文件. 2.块元素特立独行,内联元 ...
压缩JS，提高代码执行速度
压缩JS java -jar yuicompressor-2.4.jar --type js xxx.js -o xxx.js --charset utf-8 压缩CSS java -jar yuic ...
打包发布自己的nodejs包
下午的时候写了一篇关于一个不成熟的模板引擎的博客,觉得还是不太够,然后就封装了起来,做成了一款开发包.最后为了尝试一下如何发布自己的包,就又完善了一下.做此文以记之. 初衷说来也不是什么高大上的东西 ...
从无到有开发自己的Wordpress博客主题---主页模板
在只做完成了header和footer的模板之后,我们首先在之前Hello World的基础上做一个最简单的调用测试 //修改index.php内容如下 <?php get_header(); ...

Cassandra学习六 一些知识点

Cassandra学习六 一些知识点的更多相关文章

随机推荐

热门专题

Cassandra学习六一些知识点

Cassandra学习六一些知识点的更多相关文章