Cassandra配置多节点集群以及使用雅虎YCSB压测Cassandra 3.11

这几天在搭Cassandra集群以及对Cassandra的性能测试，步骤还挺多，记录一下。

关于Caaandra在服务器上配置多节点集群，可以参考一下文章：

http://blog.csdn.net/cloud_xy/article/details/48091003

http://blog.csdn.net/cloud_xy/article/details/48107251

以及Cassandra官方文档：http://cassandra.apache.org/doc/latest/getting_started/configuring.html

注意：最好关掉集群中每台服务器的防火墙，确保相应端口通过，以便节点之间能互相访问。

systemctl stop firewalld.service #停止firewall
systemctl disable firewalld.service #禁止firewall开机启动
firewall-cmd --state #查看默认防火墙状态（关闭后显示notrunning，开启后显示running）

Cassandra的具体使用请参见Cassandra日常运维：http://zqhxuyuan.github.io/2015/10/15/Cassandra-Daily/

和官方Documentation：http://cassandra.apache.org/doc/latest/getting_started/index.html

关于使用YCSB压测Cassandra 3.11.2：

准备工作·：最好仔细阅读YCSB的wiki：https://github.com/brianfrankcooper/YCSB/wiki

环境：三台服务器：ip 200.200.172.117-119

　　　Cassandra3.11.2

1.在https://github.com/brianfrankcooper/YCSB/获取源代码，解压至本地目录即可。

2.用cassandra的cqlsh创建keyspace和cloumn family

(1)新建keyspace:

cqlsh> create keyspace usertable with replication = {'class':'SimpleStrategy', 'replication_factor':3};

注意：数据复制有两种策略：

SimpleStrategy：仅用于单个数据中心和一个机架。如果您打算使用多个数据中心，请使用NetworkTopologyStrategy。
NetworkTopologyStrategy：强烈建议用于大多数部署，因为未来扩展需要扩展到多个数据中心时更容易。

replication_factor：复制因子。如果class是SimpleStrategy，则是必需的; 否则，不使用。多个节点上数据的复制数量。

复制因子1意味着一个节点上每行只有一个副本。复制因子2意味着每行的两个副本，其中每个副本位于不同的节点上。所有复制品都同样重要; 没有主要或主要副本。作为一般规则，复制因子不应超过群集中的节点数量。

(2)应用keyspace:

cqlsh> USE usertable;

(3)新建table也即cloumn family:

create table usertable (y_id varchar primary key,field0 varchar,field1 varchar,field2 varchar,field3 varchar,field4 varchar,field5 varchar,field6 varchar,field7 varchar,field8 varchar,field9 varchar);

3、查看ycsb命令格式：

#cd bin

#ycsb

usage: ./ycsb command database [options]

Commands:

    load           Execute the load phase

    run            Execute the transaction phase

    shell          Interactive mode

Databases:

    accumulo       https://github.com/brianfrankcooper/YCSB/tree/master/accumulo

    aerospike      https://github.com/brianfrankcooper/YCSB/tree/master/aerospike

    arangodb       https://github.com/brianfrankcooper/YCSB/tree/master/arangodb

    asynchbase     https://github.com/brianfrankcooper/YCSB/tree/master/asynchbase

    basic          https://github.com/brianfrankcooper/YCSB/tree/master/basic

    cassandra-cql  https://github.com/brianfrankcooper/YCSB/tree/master/cassandra

    cassandra2-cql https://github.com/brianfrankcooper/YCSB/tree/master/cassandra2

    couchbase      https://github.com/brianfrankcooper/YCSB/tree/master/couchbase

    couchbase2     https://github.com/brianfrankcooper/YCSB/tree/master/couchbase2

    dynamodb       https://github.com/brianfrankcooper/YCSB/tree/master/dynamodb

    elasticsearch  https://github.com/brianfrankcooper/YCSB/tree/master/elasticsearch

    geode          https://github.com/brianfrankcooper/YCSB/tree/master/geode

    googlebigtable https://github.com/brianfrankcooper/YCSB/tree/master/googlebigtable

    googledatastore https://github.com/brianfrankcooper/YCSB/tree/master/googledatastore

    hbase094       https://github.com/brianfrankcooper/YCSB/tree/master/hbase094

    hbase098       https://github.com/brianfrankcooper/YCSB/tree/master/hbase098

    hbase10        https://github.com/brianfrankcooper/YCSB/tree/master/hbase10

    hypertable     https://github.com/brianfrankcooper/YCSB/tree/master/hypertable

    infinispan     https://github.com/brianfrankcooper/YCSB/tree/master/infinispan

    infinispan-cs  https://github.com/brianfrankcooper/YCSB/tree/master/infinispan

    jdbc           https://github.com/brianfrankcooper/YCSB/tree/master/jdbc

    kudu           https://github.com/brianfrankcooper/YCSB/tree/master/kudu

    mapkeeper      https://github.com/brianfrankcooper/YCSB/tree/master/mapkeeper

    memcached      https://github.com/brianfrankcooper/YCSB/tree/master/memcached

    mongodb        https://github.com/brianfrankcooper/YCSB/tree/master/mongodb

    mongodb-async  https://github.com/brianfrankcooper/YCSB/tree/master/mongodb

    nosqldb        https://github.com/brianfrankcooper/YCSB/tree/master/nosqldb

    orientdb       https://github.com/brianfrankcooper/YCSB/tree/master/orientdb

    rados          https://github.com/brianfrankcooper/YCSB/tree/master/rados

    redis          https://github.com/brianfrankcooper/YCSB/tree/master/redis

    riak           https://github.com/brianfrankcooper/YCSB/tree/master/riak

    s3             https://github.com/brianfrankcooper/YCSB/tree/master/s3

    solr           https://github.com/brianfrankcooper/YCSB/tree/master/solr

    tarantool      https://github.com/brianfrankcooper/YCSB/tree/master/tarantool

    voldemort      https://github.com/brianfrankcooper/YCSB/tree/master/voldemort

Options:

    -P file        Specify workload file

    -cp path       Additional Java classpath entries

    -jvm-args args Additional arguments to the JVM

    -p key=value   Override workload property

    -s             Print status to stderr

    -target n      Target ops/sec (default: unthrottled)

    -threads n     Number of client threads (default: )

Workload Files:

    There are various predefined workloads under workloads/ directory.

    See https://github.com/brianfrankcooper/YCSB/wiki/Core-Properties

    for the list of workload properties.

ycsb: error: too few arguments

从命令格式里可以看出 -P可以加载一些配置文件 -p可以以键值对的方式加载一些配置 -s每隔一段时间输出执行信息 -threads线程数

4、新建cassandra连接文件(里面的属性可以在源码https://github.com/brianfrankcooper/YCSB/blob/master/cassandra/src/main/java/com/yahoo/ycsb/db/CassandraCQLClient.java中查看)

#vim cassandra.properties

hosts = spark131,spark130,spark129   #host列表，用逗号,隔开

port =

cassandra.keyspace = usertable    #测试表

cassandra.username = ershixiong   #cassandra用户名

cassandra.password =           #cassandra密码

cassandra.readconsistencylevel = ANY

cassandra.writeconsistencylevel = ANY

cassandra.maxconnections =

cassandra.connecttimeoutmillis =

cassandra.readtimeoutmillis  =

cassandra.properties这个文件没有的话就新建一个

注意：关于读写一致性级别的设置请参见文档：https://docs.datastax.com/en/archived/cassandra/2.0/cassandra/dml/dml_config_consistency_c.html
5、配置workload

#vim workloads/workloada

workload=com.yahoo.ycsb.workloads.CoreWorkload

readallfields=false

readproportion=0.5

updateproportion=0.5

scanproportion=

insertproportion=

requestdistribution=zipfian

fieldcount 表示每条数据中的字段数,默认为 ;

fieldlength 表示每个字段的值的长度,默认为 ;

readallfields 域用来标识是否读取所有的所有的字段,取值有 ture 或 false;

readproportion,

updateproportion,

scanproportion,

insertproportion 分别表示该 workload中读、更新、扫描和插入操作占总操作的百分比,这四个值的和为 ;

requestdistribution 表示数据的分布情况,当前支持 uniform,zipfian 和 latest,默认为 uniform;

maxscanlength 域主要为扫描操作定义,定义了最大扫描的记录数量,默认为 ;

scanlengthdistribution 域也是为扫描操作定义的,为每次扫描的长度定义相应的分布,默认是 uniform;

insertorder 域主要分两种 ordered 和 hashed,默认为 hashed;

operationcount 总共的 operation 数量;

maxexecutiontime 为该 workload 定义了最长的执行时间,单位为 s。

AverageLatency(平均潜伏期)平均潜伏期（average latency）：指当磁头移动到数据所在的磁道后，然后等待所要的数据块继续转动（半圈或多些、少些）到磁头下的时间，单位为毫秒（ms）。平均潜伏期是越小越好，潜伏期小代表硬盘的读取数据的等待时间短，这就等于具有更高的硬盘数据传输率。

注意：还有一个变量：zeropadding可以设置Key的长度，具体workloads参数请参考YCSB源码：https://github.com/brianfrankcooper/YCSB/blob/master/core/src/main/java/com/yahoo/ycsb/workloads/CoreWorkload.java

关于workload的不同类型说明（a、b、c、d）请参见官方文档：https://github.com/brianfrankcooper/YCSB/wiki/Core-Workloads

5、测试

YCSB测试包括两个阶段，Load the data 和 Run the workload

load阶段：

bin/ycsb load cassandra2-cql -P workloads/workloada -P cassandra.properties -p columnfamily=usertable -s -threads  > load_32threads.dat

run阶段：

bin/ycsb run cassandra2-cql -P workloads/workloada -P cassandra.properties -p columnfamily=usertable -s -threads  > run_32threads.dat

数据接口名为cassandra2-cql
加载ycsb的配置：workloads/workloada
加载cassandra的配置：cassandra.properties
columnfamily名称为usertable
32个线程执行

具体输出信息意义请参见官方文档：https://github.com/brianfrankcooper/YCSB/wiki/Running-a-Workload

常见错误：

1.All host(s) tried for query failed (tried: /ip (com.datastax.driver.core.TransportException：[/ip] Cannot connect), /ip (com.datastax.driver.core.TransportException: [/ip] Cannot connect))

解决：如果需要远程连接，那么cassandra.yaml里面的rpc_address就需要改变为您当前环境实际的IP地址，否则会报错！修改后就可以了！

2.SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".

SLF4J: Defaulting to no-operation (NOP) logger implementation

SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.

解决：下载最新的slf 并将slf4j-simple-1.7.7.jar和slf4j-api-1.7.7.jar复制到ycsb的lib目录：https://www.slf4j.org/download.html

Cassandra配置多节点集群以及使用雅虎YCSB压测Cassandra 3.11的更多相关文章

Hadoop 2.6.4单节点集群配置
1.安装配置步骤 # wget http://download.oracle.com/otn-pub/java/jdk/8u91-b14/jdk-8u91-linux-x64.rpm # rpm -i ...
kafka_2.11-0.8.2.2.tgz的3节点集群的下载、安装和配置（图文详解）
kafka_2.10-0.8.1.1.tgz的1或3节点集群的下载.安装和配置(图文详细教程)绝对干货一.安装前准备 1.1 示例机器二. JDK7 安装 1.1 下载地址下载地址: http: ...
kafka_2.10-0.8.1.1.tgz的1或3节点集群的下载、安装和配置（图文详细教程）绝对干货
运行kafka ,需要依赖 zookeeper,你可以使用已有的 zookeeper 集群或者利用 kafka自带的zookeeper. 单机模式,用的是kafka自带的zookeeper, 分布式模 ...
Windows下ELK环境搭建（单机多节点集群部署）
1.背景日志主要包括系统日志.应用程序日志和安全日志.系统运维和开发人员可以通过日志了解服务器软硬件信息.检查配置过程中的错误及错误发生的原因.经常分析日志可以了解服务器的负荷,性能安全性,从而及时 ...
从0开始搭建SQL Server AlwaysOn 第二篇（配置故障转移集群）
从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
『GreenPlum系列』GreenPlum 4节点集群安装（图文教程）
目标架构如上图一.硬件评估 cpu主频,核数推荐CPU核数与磁盘数的比例在12:12以上Instance上执行时只能利用一个CPU核资源进行计算,推荐高主频内存容量网络带宽重分布操作 R ...
Hyperledger Fabric 1.0 从零开始（九）——Fabric多节点集群生产启动
7:Fabric多节点集群生产启动 7.1.多节点服务器配置在生产环境上,我们沿用4.1.配置说明中的服务器各节点配置方案. 我们申请了五台生产服务器,其中四台服务器运行peer节点,另外一台服务器 ...
Cloudera Manager安装之利用parcels方式安装3或4节点集群（包含最新稳定版本或指定版本的安装）（添加服务）（CentOS6.5）（五）
参考博客 Cloudera Manager安装之利用parcels方式安装单节点集群 Cloudera Manager安装之Cloudera Manager 5.3.X安装(三)(tar方式.rpm ...
Cloudera Manager安装之利用parcels方式安装单节点集群（包含最新稳定版本或指定版本的安装）（添加服务）（CentOS6.5）（四）
不多说,直接上干货! 福利 => 每天都推送欢迎大家,关注微信扫码并加入我的4个微信公众号: 大数据躺过的坑 Java从入门到架构师人工智能躺过的坑 ...

随机推荐

bzoj 3048[Usaco2013 Jan]Cow Lineup 思想，乱搞 stl
3048: [Usaco2013 Jan]Cow Lineup Time Limit: 2 Sec Memory Limit: 128 MBSubmit: 237 Solved: 168[Subm ...
C语言_来了解一下GCC编译器编译C可执行脚本的过程
GCC简介 Linux系统下的gcc(GNU C Compiler)是GNU推出的功能强大.性能优越的多平台编译器,是GNU的代表作品之一.gcc是可以在多种硬体平台上编译出可执行程序的超级编译 ...
使用MyBatis集成阿里巴巴druid连接池（不使用spring）
在工作中发现mybatis默认的连接池POOLED,运行时间长了会报莫名其妙的连接失败错误.因此采用阿里巴巴的Druid数据源(码云链接 ,中文文档链接). mybatis更多数据源参考博客链接 . ...
MFC窗口创建、销毁消息流程
MFC应用程序创建窗口的顺序 1.PreCreateWindow()该函数是一个重载函数,在窗口被创建前,可以在该重载函数中改变创建参数,(可以设置窗口风格等等) 2.PreSubclassWindo ...
[Note] Yet Another Resource Negotiator
Yet Another Resource Negotiator Apache Hadoop YARN 是新一代资源管理调度框架,主要针对 Hadoop MapReduce 1.0 的缺陷做出了改进 M ...
[HNOI2014]道路堵塞
题目描述 A国有N座城市,依次标为1到N.同时,在这N座城市间有M条单向道路,每条道路的长度是一个正整数.现在,A国交通部指定了一条从城市1到城市N的路径,并且保证这条路径的长度是所有从城市1到城市N ...
HDP2.0测试
1.测试Hbase (1)hive导入hbase
hbase 命令
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服 ...
SpringMVC的常用注解
在SpringMVC中常用的注解主要都是用于Controller上,所以下面的四大不同类型的注解都是根据它们处理的request的不同内容部分来区分的: 处理requ ...
linux 运维，代理，acl控制访问
运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运 ...

Cassandra配置多节点集群以及使用雅虎YCSB压测Cassandra 3.11

Cassandra配置多节点集群以及使用雅虎YCSB压测Cassandra 3.11的更多相关文章

随机推荐

热门专题