1. cassandra有一个好的特点是列之间可以按照column key进行排序;这样当rowkey确定以后,对于同一个“行”的范围(range query)查找是很方便的;官方说法,每一个“行”(wide row)可以加入最多20亿个列,虽说如此,据ebay的工程师讲,实践中也没有超过百万个的;同一个row的数据值存在于同一server,不会分开的;

2. 而且column 的模式不是预先固定的,可以随时增加和删除,这样其实不仅是column value,column key我们也可以利用上,作为存放数据的地方;举一个例子,比方说。我每隔五分钟采集一个服务器的负载值,那么可以将表格设计成如下的样子;

|   hour + minute       |                               |

-------------------------+-----------------------+-----------------------+-----------------------

device_name + day    |    load value             |

就是将 服务器名字 和 天 作为rowkey,小时和分钟作为column key,然后服务器的负载值作为column value;

3.  CQL 3.0以后,剪标语句更像是传统关心型数据库的sql语句;比如说 建立一个user表,

CREATE TABLE users (

user_id int PRIMARY KEY,

name text,

company text

);

这里其实primary key,user_id 就是cassandra 在实际存储时候的rowkey;

可以出入一条记录,

INSERT INTO users (user_id, name, company)

VALUES (1, 'john', 'taobao');

4. 从上面来看,这种好像表的schema貌似已经固定了,那原有的dynamic column该怎样实现呢;最简单的方法 用alter table 修改schema,然后添加,但每回都要修改表的结构,繁琐且性能有问题;

其实CQL 3.0 提供了另一种角度解决问题的办法:

我们回过头来想想,之所有会有wide row(也就是动态column),是因为想把一个范围内的数据统一组织,方便查询(因为不用定位多个rowkey)也便于理解;同时当需要dynamic column的时候。从业务角度讲,

其实 rowkey + dynamic columin key 是可以唯一确定的,类似于RDBMS中的primary key;在CQL 3.0 中如果想建立dynamic columin 可以使用下面的建表语句,我们采用第2段落中的例子:

CREATE TABLE device_load (

device_and_day, text

hour_and_minute text,

load_value float,

primary key (device_and_day, hour_and_minute)

);

就是将 数据模型中要作为rowkey 和 dynamic column key的合在一起作为primary key, primary key 中的第一个元素就是rowkey,后面的元素的元素是column key;

这种形式,其实cassandra 的底层存储方式可以描述成:

|   row key         |                             columns                                |
|-------------------+----------------------|----------------------|----------------------|
| | 0000:"load value" | 0005:"load value" | 0010:"load value" |......
| device1+20150701 +----------------------|----------------------|----------------------|
| | 1.0 | 2.0 | 5.5 |......
|-------------------+----------------------|----------------------|----------------------|
| | 0000:"load value" | 0005:"load value" | 0010:"load value" |......
| device2+20150701 +----------------------|----------------------|----------------------|
| | 2.0 | 3.0 | 10.0 |......
|-------------------+----------------------|----------------------|----------------------|

这种情况下,当rowkey确定的时候,仍然可以对column key进行范围查询;用法如:

select load_value where device_and_day = 'device1+20150701' and hour_and_minute >= '0000' and hour_and_minute <= '1200';

5. cassandra的查询方式可以用法,就是先确定rowkey,然后再在同一行中进行范围查找;rowkey不支持直接的范围查找,只支持 = 和 in,如果要用rowkey进行范围查找需要使用token 函数;

同时,除了rowkey外,字段也不支持直接的= 查询操作, 需建立二级索引后才能支持,cassandra的索引不是Btree之类的索引,不支持范围查询,类似于hash索引;cassandra的二级索引猜测是在每一个sstable内实现的,所以不能实现的全局的查询;

cassandra CQL 3.0 怎样实现 dynamic column;的更多相关文章

  1. NoSQL Manager for Cassandra 3.2.0.1 带Key

    NoSQL Manager for Cassandra 3.2.0.1 是一个Windows平台下Cassandra 数据库的高级管理工具.请低调使用. NoSQLManagerforCassandr ...

  2. cassandra CQL 常用操作

    1. CQL客户端链接 bin/cqlsh ip username password 2. (1)建立keyspace语句,keyspace类似于 mysql 中的数据库,一个数据库中可以有很多表: ...

  3. C# 4.0 新特性-dynamic 【转】

    前段时间看过一些关于dynamic这个C#4中的新特性,看到有些朋友认为dynamic的弊大于利,如无法使用编译器智能提示,无法在编译时做静态类型检查,性能差等等.因此在这篇文章中我将就这些问题来对d ...

  4. C# 4.0 新特性dynamic、可选参数、命名参数等

    1.dynamic ExpandoObject熟悉js的朋友都知道js可以这么写 :   1 var t = new Object(); 2 t.Abc = ‘something’; 3 t.Valu ...

  5. C#4.0中的dynamic关键字和ExpandoObject对象

    dynamic最大的特点我想莫过于在它的类型在运行时才确定,这也是它与往静态类型关键字的最大区别.如果你在你的代码操作中用到了dynamic关键字去定义一个变量时,那么这个变量在编译的时候编译器不会对 ...

  6. Cassandra Vnodes在Cassandra 2.0-4.0中的演进

    Vnodes简短历史 Vnodes又叫Virtual Nodes.是Cassandra在1.2版本里引入的功能,已经在生产环境中使用了近8年了.从2.0版本开始,因为默认配置里num_tokens一般 ...

  7. C# 4.0 新特性dynamic (待学习)

    随便翻看了一下dynamic,在网上拷贝了一个例子,先贴出来等有空了再慢慢消化 static void Main(string[] args) { dynamic d = new MyDynamicO ...

  8. Apache Cassandra 4.0新特性介绍

    引言 大家好,我是蔡一凡,是Cassandra的贡献者之一.(虽然我不便透露我的公司名称),但目前我们公司Cassandra的部署是全世界最大的之一,Cassandra在我们公司也有很多的应用. Ca ...

  9. Oracle 12.1.0.2 New Feature翻译学习【In-Memory column store内存列存储】【原创】

    翻译没有追求信达雅,不是为了学英语翻译,是为了快速了解新特性,如有语义理解错误可以指正.欢迎加微信12735770或QQ12735770探讨oracle技术问题:) In-Memory Column ...

随机推荐

  1. python—面向对象编程

    面向对象编程简单来说就是基于对 类 和 对象 的使用,所有的代码都是通过类和对象来实现的编程就是面向对象编程! 面向对象的三大特性:封装.继承.多态 首先创建一个类 #使用class创建一个Schoo ...

  2. mysql查询优化器的提示(hit)

    如果对优化器选择的执行计划不满意,可以使用优化器提供的几个提示来控制最终的执行计划,关于每个提示的具体用法,建议直接阅读官方手册,一些提示和版本有直接关系,可以使用的一些提示如下: high_prio ...

  3. [问题2014A13] 复旦高等代数 I(14级)每周一题(第十五教学周)

    [问题2014A13]  设 \(V\) 是数域 \(K\) 上的 \(n\) 维线性空间, \(\varphi\) 是 \(V\) 上的幂零线性变换且满足 \(\mathrm{r}(\varphi) ...

  4. DAO

    DAO Data Access Object DAO(Data Access Object)是一个数据访问接口,数据访问:顾名思义就是与数据库打交道. 夹在业务逻辑与数据库资源中间. DAO模式是标准 ...

  5. Maven学习(二) -- 坐标和依赖

    标签(空格分隔): 学习笔记 坐标 实际就像在几何中,我们用一对坐标(x, y)来表示坐标系中唯一的点:或者我们可以用(经度,纬度)来表示地球上的某一个位置,在Maven的世界中,有坐标来唯一的表示项 ...

  6. DAL、DAO、ORM、Active Record辨析

    转自:http://blog.csdn.net/suiye/article/details/7824943 模型 Model 模型是MVC中的概念,指的是读取数据和改变数据的操作(业务逻辑).一开始我 ...

  7. VirtualBox4.3.12 Centos6.5-i386 设置共享文件夹

    新在虚拟机下安装个CentOS6.5,准备设置个与win7的共享文件夹,遇到一个问题,搞了好几天呢 现在先说一下: 首先,在虚拟机下安装好CentOS这里不说了 然后启动,点击安装增强功能 如下图: ...

  8. Js 类定义的几种方式

    提起面向对象我们就能想到类,对象,封装,继承,多态.在<javaScript高级程序设计>(人民邮电出版社,曹力.张欣译.英文名字是:Professional JavaScript for ...

  9. 《BI项目笔记》创建标准维度、维度自定义层次结构

  10. phonegap 3.3教程 地理信息api教程

    一 准备工作 phonegap3.3的地理信息教程.从零开始,首先要新建一个项目从命令行启动 可以看到这是默认的生成的www目录,在这个目录里是最原始的html文件,编译的时候在根据这里的文件生成an ...