Cassandra基础

Apache Cassandra特性

Apache Cassandra由Facebook基于Amazon的Dynamo及其在Google的Bigtable上的数据模型设计开发的面相列的数据库，实现没有单点故障的Dynamo风格的复制模型和强大的“列族”数据模型，提供高可用性和最终一致性。
1、弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。

2、始终基于架构 - Cassandra没有单点故障，它可以连续用于不能承担故障的关键业务应用程序。

3、快速线性性能 - Cassandra是线性可扩展性的，即它为你增加集群中的节点数量增加你的吞吐量。因此，保持一个快速的响应时间。

4、灵活的数据存储 - Cassandra适应所有可能的数据格式，包括：结构化，半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。

5、便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据，可以灵活地在需要时分发数据。

6、事务支持 - Cassandra支持属性，如原子性，一致性，隔离和持久性（ACID）。

7、写入 - Cassandra被设计为在廉价的商品硬件上运行。 它执行快速写入，并可以存储数百TB的数据，而不牺牲读取效率。

Cassandra节点节点

Cassandra的设计目的就是通过多个数据节点实现大数据工作负载，并通过在多个数据节点保存数据副本来解决单点故障，群集中所有节点之间对等，数据分布在群集所有节点上。

1、所有群集节点角色相同且相互独立，能同时互联到其他节点。

2、所有群集节点都可以接受读取和写入请求

3、当某群集节点关闭时，可以通过其他群集节点读取与该节点数据相同的副本。

4、当新增或移除群集节点后，群集会自动进行数据均衡

PS1: 当某节点性能不足时,可以暂停该节点不接受读写请求。

===========================================================

Cassandra数据模型

群集(Cluster)

|---群集节点(Cluster Node)

	|---键空间(Keyspace)

		|---列族(Column Famliy)

			|---普通列(Column)

			|---超级列(Super Column)

				|--子列(subColumn)

群集（Cluster）是Cassandra数据模型中最外层，包含多个群集节点，对外提供服务

群集节点（Cluster Node）用来存储数据副本，群集中所有节点功能相同。

键空间（Keyspace）是数据的最外层容器，一个键空间可用包含多个列族(Column Family)一个键空间包含以下基本属性：

　　1、复制因子，设置在群集中存储多少份数据副本

　　2、副本放置策略，设置数据副本与数据中心和机架的关系

列族（Column Family）是有序收集行的容器，每行又是一个有序的列聚合，在Cassandra中可以随时向列族中添加列，且不要求每行记录包含所有列。

Cassandra数据模型中列分为普通列和超级列：

普通列包含三个属性：键(name)\值(value)\时间戳(clock)，其存储结构为：

超级列是一个特殊列，其存储的是子列的map，其存储结构为：

===========================================================

分区键和群集键

在Cassandra中主键可分为两类：

1、单列主键

2、符合主键

对于单列主键，该主键即分区键(Partition Key)。

对于符合主键，主键的第一部分为分区键(Partition Key)，第二部分为群集键(Clustering Key)。

分区键(Partition Key)决定数据位于哪个分区，而群集键(Clustering Key)决定相同分区上的数据如何排序。

对于表：

CREATE TABLE DemoTable

(

C1 INT,

C2 INT,

C3 INT,

C4 INT,

data text,

PRIMARY KEY((C1,C2), C3,C4)

);

则C1+C2作为分区键，然后同一分区中数据按照C3和C4进行排序。

===========================================================

Cassandra的数据模型和RDBMS的数据模型的区别：

==========================================================

摘抄自：https://www.w3cschool.cn/cassandra/

==========================================================

Cassandra基础的更多相关文章

Cassandra基础3
cassandra读性能优化:1.禁用read repair每次读操作,无论读请求设置读一个节点还是多个节点,cassandra返回给客户端最新的数据后,都会后台对比所有副本的数据并对差异数据进行修复 ...
Cassandra基础2
========================================================= gossip协议1.点对点(peer to perr)的网络通信协议,节点间地位相同 ...
使用DataStax Java驱动程序的最佳实践
引言如果您想开始建立自己的基于Cassandra的Java程序,欢迎! 也许您已经参加过我们精彩的DataStax Academy课程或开发者大会,又或者仔细阅读过Cassandra Java驱动的 ...
技术基础 | 监测Apache Cassandra的简明方式——MCAC
点击这里在GitHub上访问我们,以便深入了解DataStax的开源项目--Apache Cassandra指标收集器(Metric Collector for Apache Cassandra, o ...
技术基础 | Cassandra RBAC助你打击“虚拟海盗”，让他们对数据“战利品”望而不得
现如今,我们称虚拟世界里的海盗们为"黑客",他们所追寻的战利品就是在你数据库某处的数据. 而我们能够保证你的数据安全的工具之一,就是"Cassandra基于角色的访问 ...
技术基础 | Apache Cassandra 4.0基准测试
Apache Cassandra 4.0已经发布了Beta版,这是第一个支持JDK 11及更高JDK版本的Cassandra版本. 时延对于Apache Cassandra用户来说是个显而易见的关 ...
技术基础 | 在Apache Cassandra中改变VNodes数量的影响
Apache Cassandra中num_tokens的默认值在4.0版本中将会有变化!这看起来好像只是在CHANGES.txt文件中做了个小小的改动,但实际上这个改动将会对集群的日常运维有着深远的影 ...
sstable, bigtable,leveldb,cassandra,hbase的lsm基础
先看懂文献1和2 1. 先了解sstable.SSTable: Sorted String Table [2] [10] WiscKey: 类似myisam, key value分离, 根据ssd优 ...
技术基础 | 改进版的Apache Cassandra客户端请求路由
最近我们在客户端的驱动程序中引入了一些变更,这些变更会影响传入的请求在Apache Cassandra集群内的分发方式. 新的默认负载均衡算法即将随驱动程序推出,这些算法将有助于缩短长尾延迟,并提 ...

随机推荐

Centos7 LVM扩充存储空间
一. 以root账户运行命令界面:su or su - 二. 查看分区使用情况: fdisk -l /dev/sda or fdisk -l 三. 选择要扩充的分区,以sda2为例: fdisk / ...
火狐下，td 的 bug;
想实现类似的效果,看代码, <div style="width:488px;float:left; margin:-52px 0px 15px 15px;"> < ...
Mybatis级联，使用JOIN和Associa,以及一些ID覆盖和自动变换。
先说下坑,比如数据库的字段是 DW_ID ,用generator讲mybatis自动转换的时候,会省略下表_变成dwId,所以我们之后自己手动设计的时候也尽量换成dwId: generate的myb ...
使用ext httpProxy代理获取列表但列表展示不全的问题解决
今天项目中遇到一个奇葩的事情,使用ext的jsonstore通过httpproxy代理想要获取一个列表,页面显示是有五条数据的但是却只展示了2条,于是各种排查,后台确定无误后开始检查前台,发现浏览器中 ...
kbmMW基于硬件生成随机数
按作者的说法,Delphi提供的生成随机数不是真正随机的,因为他是根据种子计算的,即种子+算法生成的随机数,如果被人知道原始种子值和算法的调用次数,则可以重现随机数,因此在安全领域,这是不安全的.同时 ...
Oracle自我补充之OVER()函数介绍
OVER(PARTITION BY)函数介绍开窗函数 Oracle从8.1.6开始提供分析函数,分析函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是:对于每个组返 ...
Jquery的deferred对象，看这2篇牛人的文章，基本就够了。
http://blog.csdn.net/ligang2585116/article/details/51589073 http://www.ruanyifeng.com/blog/2011/08/a ...
【leetcode】290. Word Pattern
problem 290. Word Pattern 多理解理解题意!!! 不过博主还是不理解,应该比较的是单词的首字母和pattern的顺序是否一致.疑惑!知道的可以分享一下下哈- 之前理解有误,应该 ...
MySQL篇，第四章：数据库知识4
MySQL 数据库 4 数据备份(在Linux终端操作) 1.命令格式 mysqldump -u用户名 -p 源库名 > 路径/XXX.sql 2.源库名的表示方式 --all-database ...
检查服务器主从状态的脚本-check_server_state.sh
分别检查服务器在Master/Slave状态下,各项服务是否正常,否则报警: 原来使用keepalived每隔1分钟调用,由于执行结果对keepalived的weight参数有影响,所以移动到外部,使 ...

Cassandra基础

Cassandra基础的更多相关文章

随机推荐

热门专题