3大主流NoSQL数据库性能对比测试报告
近日,知名独立基准测评机构Bankmark,针对目前市面上主流的NoSQL数据库SequoiaDB、MongoDB以及Cassandra三款NoSQL数据库产品做了性能对比测试并发布测试报告。在所有的测试中,三款NoSQL数据库产品的表现各有千秋,没有那款产品能在所有测试场景中完败对手,就整体表现而言SequoiaDB与Cassandra不相上下表现上佳,而MongoDB表现却不理想属于垫底的存在。
测试机构:
Bankmark是一家德国的独立基准测评机构,业内著名的NoSQL性能测试团队。
测试产品:
MongoDB(目前名气最大,用的人最多的NoSQL数据库,占据了非关系型数据库的主流位置。)
SequoiaDB(由前IBM DB2团队的研发人员创建,据称在性能和功能上能够与MongoDB做正面抗衡。)
Cassandra(是Facebook的数据库系统的开源分支,支持者众多,而Cassandra能一直稳压HBase(高贵的血统,与Hadoop天然集成)长期霸占列存储第一更是其优越性的强有力证明。)
测试环境:
Bankmark使用了 Yahoo Cloud Serving Benchmark(YCSB)测试框架作为测试工具。
所有的测试都在物理硬件上进行,没有使用任何虚拟化的层级。
所有的数据库测试都在一个10节点的集群上进行,其中10台服务器(Dell PowerEdge R520(5台)、Dell PowerEdge R720(5台))作为数据库系统的主机,5台(HP ProLiant BL465c)刀片机作为YCSB客户端。
测试结果:
从报告结果来看,没有那款产品能在所有测试场景中全部击败对手,在“大部分内存环境”的设定下,SequoiaDB的性能明显优于其他的产品,除了在Cassandra的强项“读多写少”。在“全内存环境”下测试结果表明,SequoiaDB拥有更快速的读请求性能,而Cassandra在写请求下表现要好于SequoiaDB。然而,在所有的测试案例中,MongoDB几乎都是最慢的。更多内容请见测试报告(NoSQL Performance Test)
大部分内存环境(Mostly-in-memory):原始数据大小为总RAM大小的1/4
全内存环境(in-memory):原始数据大小为总RAM大小的1/2
测试场景1: 2亿条记录(每个节点2000万)
在本实验中,全内存环境下(原(始)数据大小大约占系统总内存的45%左右 )
1、单条数据导入

▲单条记录载入测试
从上图结果中可以看到,在全内存环境下,单条记录载入操作,Cassandra最高,总吞吐量可达每秒近7万,Mongodb最差。
2、批量数据导入(1000条记录一批次)

▲批量记录载入测试
在该测试中,数据为每批次1000条,测试结果显示,SequoiaDB可以达到每秒钟近6.5万的导入速度。
3、Zipfian分布,100%读

▲单纯随机查询测试
单纯随机查询的测试中,SequoiaDB表现最为突出,Mongodb次之。
4、Zipfian分布,50%读,50%更新

▲查询更新平衡测试
在查询更新平衡测试中(50%读,50%更新),Sequoiadb表现最佳,Mongodb表现最不理想。
5、Zipfian分布,5%读,95%更新

▲更新为主的测试
在以更新为主的测试中(5%查询,95%更新),Cassandra表现最佳。
6、Zipfian分布,95%读,5%更新

▲查询为主的测试
在以查询为主的测试中(95%查询,5%更新),mongodb表现最优秀,Cassandra最差
7、latest分布,95%读,5%插入

▲查询最新测试
从图中可以看出,查询最新测试中,SequoiaDB对于刚刚写入至内存中便读取的场景性能最佳,Cassandra最差
测试场景2: 1亿条记录(每个节点1000万)
在本案例/实验中,大部分内存环境下(原(始)数据大小大约占系统总内存的22%左右)
1、单条记录导入

▲单条记录导入测试
从上图结果中可以看到,在大部分内存环境下,单条记录载入操作,Sequoiadb最佳。这与在全内存环境下结果发生了变化。
2、批量数据导入

▲批量载入测试
测试结果显示,SequoiaDB可以达到每秒钟7万多的导入速度。
3、Zipfian分布,100%读

▲单纯随机查询的测试
单纯随机查询的测试中,SequoiaDB表现依然是最为突出,Cassandra次之。。
4、Zipfian分布,50%读,50%更新

▲查询更新平衡的测试
在查询更新平衡测试中,50%读,50%更新,Sequoiadb依然表现最佳
5、Zipfian分布,5%读,95%更新

▲更新为主的测试
在以更新为主的场景测试中(5%查询,95%更新),Cassandra秒杀对手。
6、Zipfian分布,95%读,5%更新

▲查询为主的测试
在以查询为主的场景中(95%查询,5%更新),Cassandra表现最佳,Mongodb反而表现最差
7、 latest分布,95%读,5%插入

▲查询最新的测试
从图中可以看出,与全内存环境不同的结果,SequoiaDB依然最快,Cassandra超过Mongodb仅次于SequoiaDB。
3大主流NoSQL数据库性能对比测试报告的更多相关文章
- 几款主流 NoSql 数据库的对比
最近小组准备启动一个 node 开源项目,从前端亲和力.大数据下的IO性能.可扩展性几点入手挑选了 NoSql 数据库,但具体使用哪一款产品还需要做一次选型. 我们最终把选项范围缩窄在 HBase.R ...
- HBase、Redis、MongoDB、Couchbase、LevelDB主流 NoSQL 数据库的对比
最近小组准备启动一个 node 开源项目,从前端亲和力.大数据下的IO性能.可扩展性几点入手挑选了 NoSql 数据库,但具体使用哪一款产品还需要做一次选型. 我们最终把选项范围缩窄在 HBase.R ...
- 几款主流 NoSql 数据库的对比(转)
转自:http://www.cnblogs.com/vajoy/p/5471308.html 最近小组准备启动一个 node 开源项目,从前端亲和力.大数据下的IO性能.可扩展性几点入手挑选了 NoS ...
- 主流的Nosql数据库的对比
主流的Nosql数据库的对比 MongoDB,Cassandra,CouchDB,Hypertable, Redis,Riak,Neo4j,Hadoop HBase, Couchbase,Mem ...
- Elasticsearch的几种架构(ELK,EL,EF)性能对比测试报告
Elasticsearch的几种架构性能对比测试报告 1.前言 选定了Elasticsearch作为存储的数据库,但是还需要对Elasticsearch的基础架构做一定测试,所以,将研究测试报告输出如 ...
- 两大主流开源分布式存储的对比:GlusterFS vs. Ceph
两大主流开源分布式存储的对比:GlusterFS vs. Ceph 存储世界最近发生了很大变化.十年前,光纤通道SAN管理器是企业存储的绝对标准,但现在的存储必须足够敏捷,才能适应在新的基础架构即服务 ...
- 6 大主流 Web 框架优缺点对比:15篇前端热文回看
摘自:http://blog.csdn.net/VhWfR2u02Q/article/details/78993079 注:以下文章,点击标题即可阅读 <6 大主流 Web 框架优缺点对比> ...
- 主流 NoSQL 数据库对比
HBase HBase 是 Apache Hadoop 中的一个子项目,属于 bigtable 的开源版本,所实现的语言为Java(故依赖 Java SDK).HBase 依托于 Hadoop 的 H ...
- 8种主流NoSQL数据库对比
摘要:虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之后垄断即将被打破.这只是时间问题:被迫使用关系数据库,但最终发现不能适应需求的情况不胜枚举. 简介 NoSQL,是一项全新的数据库革命 ...
随机推荐
- C++中的一些定义
PS: 这篇博客用来记录一些一般的C++书中草草掠过的一些概念. 或者一些不太容易理解的概念的详细解释. 欢迎新手进入,欢迎高手指正! Orz . 引用: 为对象起了另外一个名字, 引用类型引用(re ...
- Android下利用SQLite数据库实现增删改查
1: 首先介绍如何利用adb查看数据库 1: adb shell 2: cd /data/data/包名/databases 3: sqlite3 数据库 4 接下来就可以进行数据库的sql语法 ...
- 抓包工具__Windows
我常使用的: 1. SoftPerfect Network Protocol Analyzer 2. fiddler . fiddler2 3.
- 【转】《深入理解计算机系统》C程序中常见的内存操作有关的典型编程错误
原文地址:http://blog.csdn.net/slvher/article/details/9150597 对C/C++程序员来说,内存管理是个不小的挑战,绝对值得慎之又慎,否则让由上万行代码构 ...
- 报错Database returned an invalid value in QuerySet.datetimes(). Are time zone definitions for your database and pytz installed?解决
在django中的setting.py中: LANGUAGE_CODE = 'en-us' TIME_ZONE = 'Asia/Shanghai' #'UTC' USE_I18N = True USE ...
- 线程高级应用-心得4-java5线程并发库介绍,及新技术案例分析
1. java5线程并发库新知识介绍 2.线程并发库案例分析 package com.itcast.family; import java.util.concurrent.ExecutorServi ...
- Oracle数据库高级查询(五)集合查询
现实需求有时候需要将多个查询组合到一个查询中去 这时就需要使用集合查询操作了 这个操作类似于数学中的交集,并集,和补集的操作 交集就是返回两个查询共有的记录,关键字是INTERSECT 并集是返回 ...
- 【Todo】【读书笔记】机器学习实战(Python版)
还是把这本书的读书笔记,单独拎出来吧,因为内容比较多. P38. Logistic 回归. 觉得还蛮实用的.囫囵吞枣看的.要细看.
- Linux系统负载排查
参考 http://www.ruanyifeng.com/blog/2011/07/linux_load_average_explained.html 在Linux系统中,我们一般使用uptime命 ...
- select动态增加option
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xht ...