Cassandra基础2

=========================================================

gossip协议
1、点对点(peer to perr)的网络通信协议，节点间地位相同。
2、两个节点间断性地交换自身信息及其知道的信息，每秒最多和群集中三个节点交换信息。
3、每条交换信息中包含版本信息，新版本的信息会覆盖掉就版本的信息。
4、通过多次交换各节点能获取到整个群集其他节点的信息。

=========================================================

seed nodes配置建议：
1、为避免gossip通信出现问题，建议群集中所有节点都有相同的seed nodes列表，seed nodes列表仅用于节点加入到群集时bootstrap过程使用。
2、在多数据中心集群环境，确保每个数据中心至少有一个节点在seed nodes列表中，为提高容错性，建议为每个数据中心指派多个seed node。
3、为避免影响gossip性能，建议为每个数据中心最多配置3个节点到seed nodes列表中。

=========================================================

失败检测和恢复
1、通过信息交换，系统能自动判断出群集中某个节点发生故障或存在性能问题，并避免将请求路由到该节点。
2、可以通过配置phi_convict_threshold属性来调节失败检查的敏感性，当网络较差时，可以适当调高该阈值。
3、对于故障节点，系统仍会定期进行检查，确定该节点是否恢复正常。
4、对于长期失效节点，建议将其移除节点
5、对于重新回归的节点，需要对进行repair修复数据。hintedhandoff有时间限制，默认三小时，超过此时间前面的数据会不断的被覆盖掉，需要手动repair。

=========================================================
分区器(partitioners):
分区器用来决定数据在群集的那些节点进行存储(包含副本数据)，Cassandra提供三种partitioners：
1、Murmur3Partitioner(默认): 基于MurmurHash hash值将数据均匀的分布在集群
2、RandomPartitioner: 基于MD5 hash值将数据均匀的分布在集群中
3、ByteOrderedPartitioner: 通过键的字节来保持数据词汇的有序分布

Murmur3Partitioner使用MurmurHash hash算法，而RandomPartitioner使用加密hash算法，因此Murmur3Partitioner比RandomPartitioner有3至5倍的性能提升。

ByteOrderedPartitioner使得数据按照主键有序排列，运行通过主键进行有序扫描，该功能可以通过index来实现，而ByteOrderedPartitioner分区器很难实现负载均衡和数据热点问题，因此不建议使用。

=========================================================

Cassandra数据维护
当数据发生修改(增删改)操作时，Cassandra将先将修改日志写到Commit Log，然后在把数据写到Memtable，再将Memtable中数据顺序Flush到磁盘保存在SSTable中，

当Memtable中数据超过配置阈值或Commitlog的空间超过commitlog_total_space_in_mb的值时，便会触发Flush操作。

Cassandra将数据刷新到SSTable，会将带有新时间戳的数据写入到新的SSTable中，不会覆盖会追加到旧的SSTable，因此不同的SSTable可能保存同一行数据的多个版本，为保证数据库的健康性，Cassandra周期性的合并SSTables,并将老数据废弃掉，该行为被称为合并压缩。

Cassandra提供以下压缩策略：
1、SizeTieredCompactionStrategy(STCS)
2、LeveledCompactionStrategy(LCS)
3、TimeWindowCompactionStrategy(TWCS)
4、DateTieredCompactionStrategy(DTCS)

=========================================================

SizeTieredCompactionStrategy(STCS)
当Cassandra 相同大小的SSTables数目达到一个固定的数目(默认是4),STCS开始将多个SSTable压缩成一个更大的SSTable。
优势：写占比高的情况压缩很好
劣势: 可能将过期的数据保存的很久，随着时间推移，需要的内存大小随之增加。
适用场景：写占比高的场景。

=========================================================
LeveledCompactionStrategy(LCS)
LCS会将数据合并压缩成多个层级，每一层是上一层的10倍。LCS压缩过程确保了从L1层开始的SSTables不会有重复的数据。
优势：磁盘空间的要求容易预测。读操作的延迟更容易预测。过时的数据回收的更及时。
劣势: 更高的I/O使用影响操作延迟。
适用场景：读占比高的场景

=========================================================

TimeWindowCompactionStrategy(TWCS)
TWCS基于时间窗口将SSTable进行分组，
优势: 用作时间序列数据，为表中所有数据使用默认的TTL。比DTCS配置更简单。
劣势: 不适用于时间乱序的数据，因为SSTables不会继续做压缩，存储会没有边界的增长，所以也不适用于没有设置TTL的数据。相比较DTCS，需要更少的调优配置。
适用场景：时间序列且设置了TTL的场景

DateTieredCompactionStrategy(DTCS)
DTCS类似于TWCS，已弃用。

摘抄自：https://blog.csdn.net/FS1360472174/column/info/14229

Cassandra基础2的更多相关文章

Cassandra基础3
cassandra读性能优化:1.禁用read repair每次读操作,无论读请求设置读一个节点还是多个节点,cassandra返回给客户端最新的数据后,都会后台对比所有副本的数据并对差异数据进行修复 ...
Cassandra基础
Apache Cassandra特性 Apache Cassandra由Facebook基于Amazon的Dynamo及其在Google的Bigtable上的数据模型设计开发的面相列的数据库,实现没有 ...
使用DataStax Java驱动程序的最佳实践
引言如果您想开始建立自己的基于Cassandra的Java程序,欢迎! 也许您已经参加过我们精彩的DataStax Academy课程或开发者大会,又或者仔细阅读过Cassandra Java驱动的 ...
技术基础 | 监测Apache Cassandra的简明方式——MCAC
点击这里在GitHub上访问我们,以便深入了解DataStax的开源项目--Apache Cassandra指标收集器(Metric Collector for Apache Cassandra, o ...
技术基础 | Cassandra RBAC助你打击“虚拟海盗”，让他们对数据“战利品”望而不得
现如今,我们称虚拟世界里的海盗们为"黑客",他们所追寻的战利品就是在你数据库某处的数据. 而我们能够保证你的数据安全的工具之一,就是"Cassandra基于角色的访问 ...
技术基础 | Apache Cassandra 4.0基准测试
Apache Cassandra 4.0已经发布了Beta版,这是第一个支持JDK 11及更高JDK版本的Cassandra版本. 时延对于Apache Cassandra用户来说是个显而易见的关 ...
技术基础 | 在Apache Cassandra中改变VNodes数量的影响
Apache Cassandra中num_tokens的默认值在4.0版本中将会有变化!这看起来好像只是在CHANGES.txt文件中做了个小小的改动,但实际上这个改动将会对集群的日常运维有着深远的影 ...
sstable, bigtable,leveldb,cassandra,hbase的lsm基础
先看懂文献1和2 1. 先了解sstable.SSTable: Sorted String Table [2] [10] WiscKey: 类似myisam, key value分离, 根据ssd优 ...
技术基础 | 改进版的Apache Cassandra客户端请求路由
最近我们在客户端的驱动程序中引入了一些变更,这些变更会影响传入的请求在Apache Cassandra集群内的分发方式. 新的默认负载均衡算法即将随驱动程序推出,这些算法将有助于缩短长尾延迟,并提 ...

随机推荐

Vue基础以及指令
Vue 基础篇一一.Vue框架介绍之前大家学过HTML,CSS,JS,JQuery,Bootstrap,现在我们要学一个新的框架Vue~ Vue是一个构建数据驱动的web界面的渐进式框架. 目 ...
linux 系统监控、诊断工具之 lsof 用法简介
1.lsof 简介 lsof 是 Linux 下的一个非常实用的系统级的监控.诊断工具. 它的意思是 List Open Files,很容易你就记住了它是 "ls + of"的组合 ...
深入理解java虚拟机---虚拟机工具jinfo(十五)
作用: 实时查看和调整虚拟机参数. jinfo 是jdk自带的一个工具,它可以用来查看正在运行的java应用程序的扩展参数(JVM中-X标示的参数):甚至支持在运行时修改部分参数. 1.通过以下的命令 ...
MATLAB 地图工具箱 m_map 的安装和入门技巧(转）
reference: http://blog.sina.com.cn/s/blog_8fc890a20102v6pm.html 需要用一些地图工具,arcgis懒得装了,GMT(generic m ...
DevExpress WinForms使用教程：新的CheckEdit样式
[DevExpress WinForms v18.2下载] 在最开始CheckEdit控件有16种样式, 使用CheckStyle属性,开发人员可以选择其中一种样式.随着时间推移,与其他Windows ...
DevExpress v18.1新版亮点——Analytics Dashboard篇（二）
用户界面套包DevExpress v18.1日前正式发布,本站将以连载的形式为大家介绍各版本新增内容.本文将介绍了DevExpress Analytics Dashboard v18.1 的新功能,快 ...
关于这次安装Oracle
前后大概经历了一个星期,今天下午(先是用的Navicat)当我尝试性的把用户名上方的复选项从服务名换成SID时,竟然瞬间连接成功了,整个人都是蒙B的,这样就好了? 之后我又用PLsql测试了一下,秒进 ...
ChinaCock界面控件介绍-CCButton
即将发布的ChinaCock新版本,将带来一个CCButton控件,实现可视按钮.Delphi原生的Button,在上面滑动后,当释放手指时会误触发OnClick事件,这不是我们想要的结果,CCBut ...
django中scrf的实现机制
第一步:django第一次响应来自某个客户端的请求时,后端随机产生一个token值,把这个token保存在SESSION状态中,后端把这个token放到cookie中交给前端页面. 第二步:下次前端需 ...
Day3作业及默写
1.有变量量name = "aleX leNb" 完成如下操作: 移除 name 变量对应的值两边的空格,并输出处理结果 print(name.strip()) 移除 name 变 ...

Cassandra基础2

Cassandra基础2的更多相关文章

随机推荐

热门专题