一、Cassandra简介

1、基础描述

Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发，用于储存收件箱等简单格式数据，此后，由于Cassandra良好的可扩展性，逐渐发展成为了一种流行的分布式结构化数据存储方案。

2、特点分析

弹性可扩展性

Cassandra是高度可扩展的;它允许添加更多的硬件以适应更多的客户和更多的数据根据要求，可以根据业务的数据流量轻松扩展集群规模。

架构特点

Cassandra可以基于分布式运行，并采用了许多容错机制。由于去中心化无主的策略，所以没有单点故障。可以做到不停服滚动升级。这是因为Cassandra可以支持多个节点的临时失效（取决于群集大小），对群集的整体性能影响可以忽略不计。并且Cassandra提供多地域容灾。Cassandra允许将数据复制到其他数据中心，并在多个地域保留多副本，十分适用于不能承担故障的关键业务，必须持续提供服务的应用程序。

数据存储机制

Cassandra适应所有可能的数据格式，包括：结构化，半结构化和非结构化。可以根据业务的需要动态地适应变化的数据结构，并且通过在多个数据中心之间复制数据，可以灵活地在需要时分发数据。有许多案例证明Cassandra可以在金融，医疗，物联网等领域使用。

资源整合能力

Cassandra可以很容易的跟其他开源组件做集成，其中包括Hadoop，Spark，Kafka，Solr等系列组件，成为大数据业务处理里面重要的一个角色。

二、集群环境搭建

1、环境概览

jdk1.8
apache-cassandra-3.11.7-bin.tar.gz
centos7
三台服务：hop01、hop02、hop03节点

2、安装包处理

tar -zxvf apache-cassandra-3.11.7-bin.tar.gz

mv apache-cassandra-3.11.7 cassandra3.11

3、环境变量

[root@hop01 opt]# vim /etc/profile

export CASSANDRA_HOME=/opt/cassandra3.11

export PATH=$PATH:$CASSANDRA_HOME/bin

[root@hop01 opt]# source /etc/profile

4、创建目录

# 数据目录

mkdir -p /data/cassandra/data

# 日志目录

mkdir -p /data/cassandra/log

5、集群配置

vim /opt/cassandra3.11/conf/cassandra.yaml

# 配置集群名称

cluster_name: 'CasCluster'

# 配置数据目录

data_file_directories:

     - /data/cassandra/data

# 配置日志目录

commitlog_directory: /data/cassandra/log

# 设置监听地址，当前服务IP

listen_address: 192.168.72.132

# 配置RPC服务

start_rpc: true

rpc_address: 192.168.72.132

# 配置集群节点

seed_provider:

    - class_name: org.apache.cassandra.locator.SimpleSeedProvider

      parameters:

          - seeds: "192.168.72.132,192.168.72.138,192.168.72.139"

将该配置分发到集群的每个节点，注意listen_address和rpc_address是节点自己的IP地址即可。

6、启动集群

# 集群下节点依次执行启动命令

cassandra -R

# 查看节点状态

nodetool status

7、基础操作

进入命令行

cqlsh hop01

创建keyspace,并选择

CREATE KEYSPACE IF NOT EXISTS castest WITH REPLICATION = {'class': 'SimpleStrategy','replication_factor':3};

use castest ;

创建表，写入数据

CREATE TABLE user_info (id int, user_name varchar, PRIMARY KEY (id) );

INSERT INTO user_info (id,user_name) VALUES (1,'user01');

查询数据

select * from user_info ;

基于其他服务查看数据，可以看到数据已经在集群间做了同步过程:

三、集成SpringBoot框架

1、核心依赖

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-web</artifactId>

    <version>${spring.boot.version}</version>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-data-cassandra</artifactId>

    <version>${spring.boot.version}</version>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-data-jpa</artifactId>

    <version>${spring.boot.version}</version>

</dependency>

这里核心需要cassandra依赖和操作的API依赖。

2、核心配置

spring:

  data:

    cassandra:

      keyspace-name: castest

      contact-points: 192.168.72.138,192.168.72.132,192.168.72.139

      port: 9042

      cluster-name: CasCluster

keyspace-name：类似关系型数据库的名称；

contact-points：集群下节点的IP地址；

port：默认端口；

cluster-name：上述配置的集群名称；

3、基于Template命令

CassandraTemplate模板类，实现了一系列操作Cassandra数据库的基本方法，直接注入即可使用。

@Repository

public class UserInfoTemplate {

    @Resource

    private CassandraTemplate cassandraTemplate ;

    // 查询全部数据

    public List<UserInfo> getList (){

        return cassandraTemplate.select("SELECT * FROM user_info",UserInfo.class) ;

    }

    // 添加数据

    public UserInfo insert (UserInfo userInfo){

        return cassandraTemplate.insert(userInfo) ;

    }

    // 根据主键查询

    public UserInfo selectOneById (Integer id){

        return cassandraTemplate.selectOneById(id,UserInfo.class) ;

    }

    // 修改数据

    public UserInfo update (UserInfo userInfo){

        return cassandraTemplate.update(userInfo) ;

    }

    // 删除数据

    public Boolean deleteById (Integer id){

        return cassandraTemplate.deleteById(id,UserInfo.class) ;

    }

}

4、基于Repository接口

SpringBoot框架中定义的数据库访问核心接口。

接口实现

import com.cassand.cluster.entity.UserInfo;

import org.springframework.data.repository.CrudRepository;

public interface UserInfoRepository extends CrudRepository<UserInfo,Integer> {

}

接口用法

@Service

public class RepositoryService {

    @Resource

    private UserInfoRepository userInfoRepository ;

    // 保存

    public UserInfo save (UserInfo userInfo){

        return userInfoRepository.save(userInfo) ;

    }

    // 查询

    public UserInfo getById (Integer id){

        return userInfoRepository.findById(id).get() ;

    }

    // 修改

    public UserInfo update (UserInfo userInfo){

        // 主键ID存在的情况即为修改

        return userInfoRepository.save(userInfo);

    }

    // 删除

    public void deleteById (Integer id){

        userInfoRepository.deleteById(id);

    }

}

5、实体表结构

注意这里的注解是基于cassandra特定的一套。

import org.springframework.data.cassandra.core.mapping.Column;

import org.springframework.data.cassandra.core.mapping.PrimaryKey;

import org.springframework.data.cassandra.core.mapping.Table;

@Table("user_info")

public class UserInfo {

    public UserInfo(Integer id, String userName) {

        this.id = id;

        this.userName = userName;

    }

    @PrimaryKey

    private Integer id ;

    @Column(value = "user_name")

    private String userName ;

}

四、源代码地址

GitHub·地址

https://github.com/cicadasmile/data-manage-parent

GitEE·地址

https://gitee.com/cicadasmile/data-manage-parent

推荐阅读：数据源管理系列

序号	标题
01	数据源管理：主从库动态路由，AOP模式读写分离
02	数据源管理：基于JDBC模式，适配和管理动态数据源
03	数据源管理：动态权限校验，表结构和数据迁移流程
04	数据源管理：关系型分库分表，列式库分布式计算
05	数据源管理：PostGreSQL环境整合，JSON类型应用
06	数据源管理：基于DataX组件，同步数据和源码分析
07	数据源管理：OLAP查询引擎，ClickHouse集群化管理
08	数据源管理：Kafka集群环境搭建，消息存储机制详解
09	数据源管理：搜索引擎框架，ElasticSearch集群模式

数据源管理 | 分布式NoSQL系统，Cassandra集群管理的更多相关文章

一步到位分布式开发Zookeeper实现集群管理
说到分布式开发Zookeeper是必须了解和掌握的,分布式消息服务kafka .hbase 到hadoop等分布式大数据处理都会用到Zookeeper,所以在此将Zookeeper作为基础来讲解. Z ...
【拆分版】Docker-compose构建Zookeeper集群管理Kafka集群
写在前边在搭建Logstash多节点之前,想到就算先搭好Logstash启动会因为日志无法连接到Kafka Brokers而无限重试,所以这里先构建下Zookeeper集群管理的Kafka集群. 众 ...
运维利器-ClusterShell集群管理操作记录
在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了!写个shell去 ...
Clustershell集群管理
在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了!写个shell去 ...
运维利器-ClusterShell集群管理
在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了!写个shell去 ...
Spark的集群管理器
上篇文章谈到Driver节点和Executor节点,但是如果想要运行Driver节点和Executor节点,就不能不说spark的集群管理器.spark的集群管理器大致有三种,一种是自带的standa ...
[转载] 一共81个，开源大数据处理工具汇总（下），包括日志收集系统/集群管理/RPC等
原文: http://www.36dsj.com/archives/25042 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统.消息系统.分布式服务 ...
一共81个，开源大数据处理工具汇总（下），包括日志收集系统/集群管理/RPC等
作者:大数据女神-诺蓝(微信公号:dashujunvshen).本文是36大数据专稿,转载必须标明来源36大数据. 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要 ...
架构设计 | 分布式系统调度，Zookeeper集群化管理
本文源码:GitHub·点这里 || GitEE·点这里一.框架简介 1.基础简介 Zookeeper基于观察者模式设计的组件,主要应用于分布式系统架构中的,统一命名服务.统一配置管理.统一集群管理 ...

随机推荐

ATX学习（一）-atx-server
今天无意中发现了ATX手机设备管理平台,瞬间勾引起了我极大的兴趣,这里对学习过程中的情况做个记录. 1.搭建环境先按照作者步骤搭建环境出来吧,哇,突然发现ATX搭建环境很方便(一会就搭建好了) ...
jmeter零散知识点
hostapd阅读（openwrt）-4
接下来,咱们来看看hostapd的源码目录之hostapd,今天我们先分析整体功能,然后从main.c开始注释 hostapd下代码主要作用有:配置解析,环境初始化,控制接口建立,AP接口管理模块. ...
Linux内存参数
用free -m查看的结果:# free -m total used free shared buffers cachedMem: 50 ...
laravel 验证码使用示例
一.去https://packagist.org/网站搜索验证码的代码依赖,关键词:captcha 地址:https://packagist.org/packages/mews/captcha 二.环 ...
IO—》File类
IO概述回想之前写过的程序,数据都是在内存中,一旦程序运行结束,这些数据都没有了,等下次再想使用这些数据,可是已经没有了.那怎么办呢?能不能把运算完的数据都保存下来,下次程序启动的时候,再把这些数据 ...
IntelliJ IDEA 2020.2正式发布，诸多亮点总有几款能助你提效
向工具人致敬.本文已被 https://www.yourbatman.cn 收录,里面一并有Spring技术栈.MyBatis.JVM.中间件等小而美的专栏供以免费学习.关注公众号[BAT的乌托邦]逐 ...
PHP array_uintersect_assoc() 函数
实例比较两个数组的键名和键值(使用内建函数比较键名,使用用户自定义函数比较键值),并返回交集: <?phpfunction myfunction($a,$b){if ($a===$b){ret ...
Python time ctime()方法
描述 Python time ctime() 函数把一个时间戳(按秒计算的浮点数)转化为time.asctime()的形式.高佣联盟 www.cgewang.com 如果参数未给或者为None的时候, ...
PHP filectime() 函数
定义和用法 filectime() 函数返回指定文件的上次修改时间. 该函数将检查文件的日常修改情况和 inode 修改情况.inode 修改情况是指:权限的修改.所有者的修改.用户组的修改或其他元数 ...

数据源管理 | 分布式NoSQL系统，Cassandra集群管理