写在前面

cassandra3.x官方文档的非官方翻译。翻译内容水平全依赖本人英文水平和对cassandra的理解。所以强烈建议阅读英文版cassandra 3.x 官方文档。此文档一半是翻译,一半是个人对cassandra的认知。尽量将我的理解通过引用的方式标注,以示区别。另外文档翻译是项长期并有挑战的工作,如果你愿意加入cassandra git book,可以发信给我。当然你也可以加入我们的QQ群,104822562。一起学习探讨cassandra.

cassandra 概况

Apache Cassandra 是一个支持高扩展的开源NoSQL数据库。Cassandra非常适合在云、多数据中心存储结构化、非结构化的数据。Cassandra 支持高可用性,线性扩展,非常简单的在多个server上进行操作,支持单点故障。强大的动态数据模型支持提供了灵活性和快速响应。

cassandra 工作原理

cassandra 可扩展的架构意味着它有能力处理PB级数据,每秒上千的并发操作

特点 详解
分片行存储DB Cassandra 架构允许授权用户通过CQL在任何数据中心的节点上连接到集群的任何节点,为了易使用,CQL使用了类似SQL的语法。和cassandra进行交互的最基础的工具就是CQL shell,cqlsh.使用cqlsh,你可以创建keyspaces,tables.增删改查表数据。Cassandra3.x需要CQL2.2+支持。如果你喜欢图像化工具,可以使用DataStax DevCenter,生产环境中,DataStax 提供一系列的driver
数据自动分布 Cassandra 为集群内的节点提供跨节点的自动数据分布。数据在集群各个节点的分布是是透明的,不需要开发者或者DBA做任何事情
内置且可配置的复制 Cassandra 也提供内置的且可配置的复制,为集群节点环的数据提供跨节点的数据冗余备份。这意味着集群中任何一个节点down了,集群中的其他节点还有down节点的数据备份。复制可以进行配置,从而跨数据中心,扩地区分布
cassandra支持线性扩展 Cassandra支持线性扩展,意味着可以通过简单的增加新节点来提高集群能力。例如,如果两个节点能够支持每秒100,000个事务,4个节点就能够支持每秒200,000.8个节点就能支持400,000

注:

这个地方的线性扩展稍微有误导嫌疑,真实环境中的线性扩展不可能如上这种100%线性扩展,增加了节点,节点之间的通信时间会增加,即增加了节点后,单个节点的处理能力会有所下降。笔者之前的测试显示,差不多是70%.这个可能会和具体的业务场景有关系。

cassandra 与关系型数据库的区别

Cassandra 是基于peer to peer 通信的分布式数据库。最好的实践是1个查询对应一张表。所以数据是非范式的。正因为如此,跨table的JOIN查询不存在,尽管可以在application中去join。

NoSQL 介绍

NoSQL 通常意义上是指“不仅仅是SQ”,意味着DB可以使用不同于关系型数据库的存储数据方法。目前有很多不同类型的NoSQL数据库,因此即使是直接比较常用类型的NoSQL也没什么用。今天的DBA必须要更加全能,他们必须要知道如何运维关系型数据库和NoSQL数据库。

CQL 介绍

Cassandra Query Language(CQL) 是Cassandra 数据库管理系统的主要接口,CQL的用法和SQL类似。CQL和SQL有着相同的表结构,行列式。CQL与SQL主要的不同是CQL不支持join和子查询.相反,Cassandra 强调数据的反范式。

CQL是与Cassandra交互的首选。相比较老的Casssandra APIs,CQL性能和简单易用是大的优势

CQL 文档

包括了数据模型,例子,和命令参考

如何和Cassandra交互

cassandra进行交互的最基础的工具就是CQL shell,cqlsh.使用cqlsh,你可以创建keyspaces,tables.增删改查表数据。Cassandra3.x需要CQL2.2+支持。如果你喜欢图像化工具,可以使用DataStax DevCenter,生产环境,DataStax 提供一系列的driver

数据迁移

数据可以通过CQL INSERT命令,COPY命令和CSV文件方式,或者sstableloader 方式。但是实际上,你需要考虑你的客户端应用程序将如何查询表数据,需要首先定义数据模型。关系型数据库和NoSQL之间的范式改变,意味着直接将关系型数据库数据搬到Cassandra注定会失败。

注:

Cassandra 数据库不同于关系型数据库,它必须首先弄清楚业务的查询场景,才能去设计数据模型。

cassandra 工具

Cassandra 自动安装了nodetool

工具,一个非常有用的命令行管理工具。另外一个默认的安装工具是cassandra-stress

可以用来做基本的数据库负载性能测试

注:

nodetool 可以用来查询节点状态,节点配置信息等等,是个非常方便,必不可少的cassandra管理工具。

Cassandra 3.x官方文档(1)---关于Cassandra的更多相关文章

  1. cassandra 3.x官方文档(6)---内部原理之存储引擎

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  2. cassandra 3.x官方文档(5)---探测器

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  3. cassandra 3.x官方文档(4)---分区器

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  4. cassandra 3.x官方文档(3)---gossip通信协议及故障检测与恢复

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  5. cassandra 3.x官方文档(2)---架构解析

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  6. cassandra 3.x官方文档(7)---内部原理之如何读写数据

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  7. Spark官方文档 - 中文翻译

    Spark官方文档 - 中文翻译 Spark版本:1.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 1 概述(Overview) 2 引入Spark(Linki ...

  8. 《Spring 5官方文档》 Spring AOP的经典用法

    原文链接 在本附录中,我们会讨论一些初级的Spring AOP接口,以及在Spring 1.2应用中所使用的AOP支持. 对于新的应用,我们推荐使用 Spring AOP 2.0来支持,在AOP章节有 ...

  9. Lagom 官方文档之随手记

    引言 Lagom是出品Akka的Lightbend公司推出的一个微服务框架,目前最新版本为1.6.2.Lagom一词出自瑞典语,意为"适量". https://www.lagomf ...

随机推荐

  1. Map 接口简明

    Map 接口并没有继承Collection接口 HashMap : 哈希表数据结构,是线程不同步的,快速.允许存储 null 键,null 值.替代了 Hashtable. LinkedHashMap ...

  2. LinkedHashMap简明

    LinkedHashMap 构造方法摘要 inkedHashMap() 构造一个带默认初始容量 (16) 和加载因子 (0.75) 的空插入顺序LinkedHashMap 实例. LinkedHash ...

  3. 关于python 使用腾讯云OCR 通用印刷体识别

    腾讯的python SDK没有通用印刷体识别,所以参考了别人识别网上图片的方式:https://www.cnblogs.com/semishigure/p/7690789.html 但是咱们使用的基本 ...

  4. 【linux之crontab,启动】

    一.计划任务 atd at命令发布的任务计划 一次性的任务计划 at time ctrl+d 提交 time: 1.绝对时间:12:00 2.相对时间:+8 3.模糊时间:noon midnight ...

  5. 删数方案数(regex)

    [题目描述] 给出一个正整数序列 a,长度为 n,cyb 不喜欢完美,他要删掉一些数(也可以不删,即删掉0个),但是他不会乱删,他希望删去以后,能将 a 分成 2 个集合,使得两个非空集合的数的和相同 ...

  6. 单纯形求解线性规划(BZOJ1061)

    推荐一篇论文:http://wenku.baidu.com/view/ce5784754a7302768f99391d 我们设xi为第i个志愿者的招募次数,以样例为例,则不难列出如下的线性规划方程: ...

  7. Linux 基本概念和操作

    我们在使用Linux时,不是直接和系统打交道,而是通过shell的中间程序.在图形界面下为了实现窗口的输入和输出,linux系统为我们提供了终端模拟器Terminal,常见的终端模拟器有 gnome- ...

  8. Python中高阶函数讲解

    高阶函数讲解 1. 常规高阶函数 递归函数 格式:def func_name(variable): '''__doc__'''#函数的说明文档 if 条件表达式:#限制递归退出值 pass retur ...

  9. PHP内核之旅-1.生命周期

    1.SAPI接口 PHP具体应用的编程接口. 2.开始和结束 PHP开始执行以后会经过两个主要的阶段: 处理请求之前的开始阶段和请求之后的结束阶段. 1.1开始阶段: 1.1.1 模块初始化阶段(MI ...

  10. javac编译原理

    javac编译器的作用就是将符合java语言规范的源代码转化成符合java虚拟机规范的java字节码 经历:词法分析器->语法分析器->语义分析器->编译字节码 四个过程生成字节码文 ...