Cassandra 3.x官方文档(1)---关于Cassandra
写在前面
cassandra3.x官方文档的非官方翻译。翻译内容水平全依赖本人英文水平和对cassandra的理解。所以强烈建议阅读英文版cassandra 3.x 官方文档。此文档一半是翻译,一半是个人对cassandra的认知。尽量将我的理解通过引用的方式标注,以示区别。另外文档翻译是项长期并有挑战的工作,如果你愿意加入cassandra git book,可以发信给我。当然你也可以加入我们的QQ群,104822562。一起学习探讨cassandra.
cassandra 概况
Apache Cassandra 是一个支持高扩展的开源NoSQL数据库。Cassandra非常适合在云、多数据中心存储结构化、非结构化的数据。Cassandra 支持高可用性,线性扩展,非常简单的在多个server上进行操作,支持单点故障。强大的动态数据模型支持提供了灵活性和快速响应。
cassandra 工作原理
cassandra 可扩展的架构意味着它有能力处理PB级数据,每秒上千的并发操作
| 特点 | 详解 |
|---|---|
| 分片行存储DB | Cassandra 架构允许授权用户通过CQL在任何数据中心的节点上连接到集群的任何节点,为了易使用,CQL使用了类似SQL的语法。和cassandra进行交互的最基础的工具就是CQL shell,cqlsh.使用cqlsh,你可以创建keyspaces,tables.增删改查表数据。Cassandra3.x需要CQL2.2+支持。如果你喜欢图像化工具,可以使用DataStax DevCenter,生产环境中,DataStax 提供一系列的driver |
| 数据自动分布 | Cassandra 为集群内的节点提供跨节点的自动数据分布。数据在集群各个节点的分布是是透明的,不需要开发者或者DBA做任何事情 |
| 内置且可配置的复制 | Cassandra 也提供内置的且可配置的复制,为集群节点环的数据提供跨节点的数据冗余备份。这意味着集群中任何一个节点down了,集群中的其他节点还有down节点的数据备份。复制可以进行配置,从而跨数据中心,扩地区分布 |
| cassandra支持线性扩展 | Cassandra支持线性扩展,意味着可以通过简单的增加新节点来提高集群能力。例如,如果两个节点能够支持每秒100,000个事务,4个节点就能够支持每秒200,000.8个节点就能支持400,000 |

注:
这个地方的线性扩展稍微有误导嫌疑,真实环境中的线性扩展不可能如上这种100%线性扩展,增加了节点,节点之间的通信时间会增加,即增加了节点后,单个节点的处理能力会有所下降。笔者之前的测试显示,差不多是70%.这个可能会和具体的业务场景有关系。
cassandra 与关系型数据库的区别
Cassandra 是基于peer to peer 通信的分布式数据库。最好的实践是1个查询对应一张表。所以数据是非范式的。正因为如此,跨table的JOIN查询不存在,尽管可以在application中去join。
NoSQL 介绍
NoSQL 通常意义上是指“不仅仅是SQ”,意味着DB可以使用不同于关系型数据库的存储数据方法。目前有很多不同类型的NoSQL数据库,因此即使是直接比较常用类型的NoSQL也没什么用。今天的DBA必须要更加全能,他们必须要知道如何运维关系型数据库和NoSQL数据库。
CQL 介绍
Cassandra Query Language(CQL) 是Cassandra 数据库管理系统的主要接口,CQL的用法和SQL类似。CQL和SQL有着相同的表结构,行列式。CQL与SQL主要的不同是CQL不支持join和子查询.相反,Cassandra 强调数据的反范式。
CQL是与Cassandra交互的首选。相比较老的Casssandra APIs,CQL性能和简单易用是大的优势
CQL 文档
包括了数据模型,例子,和命令参考
如何和Cassandra交互
cassandra进行交互的最基础的工具就是CQL shell,cqlsh.使用cqlsh,你可以创建keyspaces,tables.增删改查表数据。Cassandra3.x需要CQL2.2+支持。如果你喜欢图像化工具,可以使用DataStax DevCenter,生产环境,DataStax 提供一系列的driver
数据迁移
数据可以通过CQL INSERT命令,COPY命令和CSV文件方式,或者sstableloader 方式。但是实际上,你需要考虑你的客户端应用程序将如何查询表数据,需要首先定义数据模型。关系型数据库和NoSQL之间的范式改变,意味着直接将关系型数据库数据搬到Cassandra注定会失败。
注:
Cassandra 数据库不同于关系型数据库,它必须首先弄清楚业务的查询场景,才能去设计数据模型。
cassandra 工具
Cassandra 自动安装了nodetool
工具,一个非常有用的命令行管理工具。另外一个默认的安装工具是cassandra-stress
可以用来做基本的数据库负载性能测试
注:
nodetool 可以用来查询节点状态,节点配置信息等等,是个非常方便,必不可少的cassandra管理工具。
Cassandra 3.x官方文档(1)---关于Cassandra的更多相关文章
- cassandra 3.x官方文档(6)---内部原理之存储引擎
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- cassandra 3.x官方文档(5)---探测器
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- cassandra 3.x官方文档(4)---分区器
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- cassandra 3.x官方文档(3)---gossip通信协议及故障检测与恢复
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- cassandra 3.x官方文档(2)---架构解析
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- cassandra 3.x官方文档(7)---内部原理之如何读写数据
写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...
- Spark官方文档 - 中文翻译
Spark官方文档 - 中文翻译 Spark版本:1.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 1 概述(Overview) 2 引入Spark(Linki ...
- 《Spring 5官方文档》 Spring AOP的经典用法
原文链接 在本附录中,我们会讨论一些初级的Spring AOP接口,以及在Spring 1.2应用中所使用的AOP支持. 对于新的应用,我们推荐使用 Spring AOP 2.0来支持,在AOP章节有 ...
- Lagom 官方文档之随手记
引言 Lagom是出品Akka的Lightbend公司推出的一个微服务框架,目前最新版本为1.6.2.Lagom一词出自瑞典语,意为"适量". https://www.lagomf ...
随机推荐
- 使用supervisor管理进程
Supervisor (http://supervisord.org) 是一个用 Python 写的进程管理工具,可以很方便的用来启动.重启.关闭进程(不仅仅是 Python 进程).除了对单个进程的 ...
- [LeetCode] K Inverse Pairs Array K个翻转对数组
Given two integers n and k, find how many different arrays consist of numbers from 1 to n such that ...
- 机器学习基石:13 Hazard of Overfitting
泛化能力差和过拟合: 引起过拟合的原因: 1)过度VC维(模型复杂度高)------确定性噪声: 2)随机噪声: 3)有限的样本数量N. 具体实验来看模型复杂度Qf/确定性噪声.随机噪声sigma2. ...
- codevs 2964 公共素数因数
提交地址:http://codevs.cn/problem/2964/ 2964 公共素数因数 时间限制: 1 s 空间限制: 32000 KB 题目等级 : 白银 Silver 题解 ...
- [AHOI 2005]COMMON 约数研究
Description Input 只有一行一个整数 N(0 < N < 1000000). Output 只有一行输出,为整数M,即f(1)到f(N)的累加和. Sample Input ...
- 2015 多校联赛 ——HDU5371(manacher + 枚举)
Sample Input 1 10 2 3 4 4 3 2 2 3 4 4 Sample Output Case #1: 9 要求找出一段数字. 将其分成3部分,第①和第②部分成回文字串,第②和第 ...
- ●BZOJ 2669 [cqoi2012]局部极小值
题链: http://www.lydsy.com/JudgeOnline/problem.php?id=2669 题解: 容斥,DP,DFS 先看看 dp 部分:首先呢,X的个数不会超过 8个.个数很 ...
- hdu 1130 How Many Trees?(Catalan数)
How Many Trees? Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
- bzoj1433
1433: [ZJOI2009]假期的宿舍 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 3371 Solved: 1425[Submit][Sta ...
- BZOJ4589 Hard Nim(快速沃尔什变换模板)
终于抽出时间来学了学,比FFT不知道好写到哪里去. #include <cstdio> typedef long long ll; ,p=1e9+; int k,m,n,a[N],pi[N ...