为什么企业依赖于 NoSQL
如果你关注大数据科技动向,你对 NoSQL 一定不陌生,NoSQL 是一个分布式数据库。在过去时间,数据存储一直关系型数据库天下,有着良好的控制并发操作、事务功能。虽然RDBMS很优秀,但是随着时间的推移就出现了两个关系数据库解决不了的问题:快速增长的数据规模和日渐复杂的数据模型。结果,我们看到了 NoSQL 数据库的兴起。

一、关系数据库不足
实际上,从 1979 年 Oracle 发布了第一个版本,这些数据库被设计为在单个服务器上运行,并且越大越好。而且增加这些数据库容量的唯一方法是升级服务器处理器、内存和存储,数据存储代价不断升高。随着互联网的数据呈指数级增长和 Web 应用程序的兴起,数据模型日渐复杂,关系数据库难以支撑,NoSQL 数据库也由此孕育而生。在 2006 年谷歌发布了 Bigtable 研究论文,在 2007 年亚马逊发布了 Dynamo 研究论文。而这些新的数据库旨在满足新一代企业要求:需要敏捷开发并支持任意规模运作。
二、敏捷开发
当今是以体验为中心的数字经济,企业如何保持竞争力,那么必须进行创新。由于这项创新的核心是现代 Web、移动和物联网应用程序的开发,因此开发人员必须高频提供应用程序和服务。速度和敏捷性都至关重要,因为这些应用程序的发展速度远远超过 ERP 等传统应用程序。而关系数据库是却不能很好满足于它,因为它们的固定数据模型不能很好地支持敏捷开发。
敏捷开发的核心原则是适应不断变化的应用程序需求:当需求发生变化时,数据模型也会发生变化,这是关系数据库的难以克服的问题,因为关系数据库的模型是固定的,并预先定义好的。因此,当要更改数据模型,开发人员不得不修改当初设定好的数据库结构,以适应新的需求。这会减慢或停止开发,不仅因为它是一个手动,耗时的过程,而且还会影响其他应用程序和服务。

相比之下,NoSQL 文档 数据库完全完美支持这点,因为它是无模式的,没有强制定义数据必须建模。相反,它遵循应用程序和服务。使用 NoSQL,数据模型由应用程序模型定义。应用程序和服务将数据建模作为对象。

三、如何支持任意规模运作
为了支持以指数增长的用户和数据 - 数百到数千到数百万用户,以及千兆字节到数TB的数据操作,应用程序和服务不得不进行扩展以保持性能,并且必须有效地运行。
对于扩展关系数据库而言,这是一个问题,例如,使用 Oracle ,使用 RAC 技术进行扩展就需要大量组件,昂贵且不完全可靠。因此,有效扩展和按需扩展的能力是一项挑战。它会变得越来越昂贵,因为必须购买更大更强的服务器以容纳更多用户和更多数据。此外,如果必须使数据库脱机以执行硬件升级,则可能导致停机。
然而,分布式 NoSQL 数据库利用廉价硬件进行扩展, 只需添加更多服务器即可添加更多资源。扩展能力使企业能够通过以下方式更有效地扩展:
1、不需要为满足部署而买相对称的硬件
2、利用较便宜的硬件进行拓展;
3、按需扩展,无需停机。

四、NoSQL 常见存储方式
NoSQL 常见有三种存储方式:键值存储、面向文档的数据库和面向列的数据库。接下来说明这几种存储方式以及数据库代表。

键值存储
代表:Redis、memcached
键值存储是 NoSQL 最常见存储方式,通过 key-value 形式保存数据,高速访问数据。而且根据保存时效也分为临时性、永久性和两者兼备。
面向文档的数据库
代表:MongoDB、CouchDB
面向文档的数据库数据结构要求不是很严格,不定义表结构而且可以使用复杂的查询条件
面向列的数据库
代表:HBase
面向列的数据库以列为单位进行存储,这里的列式存储其实说的是列族存储,它将数据表存储为数据列而非行的形式。列族存储优势:快速查询,易拓展,但功能相对局限。
五、NoSQL 对于事务的支持?
在这里有一个误区,由于分布式事务需要分布式协作,所以似乎必须在性能可扩展性和分布式事务支持之间进行权衡。
耶鲁大学的一名副教授 Daniel Abadi 认为这个想法是错的,可拓展的分布式系统也是可以实现事物。他提出了一个新的权衡策略,具体是在公平性、隔离性和吞吐量(FIT)三者之间进行取舍。
换句话说,有两种方法构建出具备分布式事务吞吐量的可扩展系统:
1、放弃隔离性
当放弃隔离性,一个事物是不会跟其他事物有冲突,就无需等待协作就可以完成了。而且也有一类数据约束可以确保在弱隔离下正确性。
2、放弃公平性
通过设定分布式协作的顺序最小化两者之间的时间重叠,从而减轻二者之间的相互影响,在此公平下找到最合适时间进行协作。
六、小结
构建和运行这些大规模交互式应用程序创建了一组新的技术要求。新的技术架构需要比以往更加灵活,并且需要一种能够适应前所未有的规模、速度和数据可变性的实时数据管理方法。关系数据库无法满足这些新要求,这就使得 NoSQL 逐渐流行起来。
为什么企业依赖于 NoSQL的更多相关文章
- 译:为什么使用 NoSQL 数据库
原文链接:Why NoSQL Database? 向数据时代的转变正在推动 NoSQL 随着各行各业朝着数据时代转变,商业世界正在经历巨大的变革.这是由互联网以及其他二十一世纪新技术--云计算.移动应 ...
- SQL与NoSQL(关系型与非关系型)数据库的区别
永远正确的经典答案依然是:具体问题具体分析. 数据表VS.数据集 关系型和非关系型数据库的主要差异是数据存储的方式.关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储, ...
- SQL VS NoSQL
(关系型与非关系型)数据库的区别: 关系型和非关系型数据库的主要差异是数据存储的方式 1.1 数据表 VS 数据集 关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储, ...
- MongoDB自学笔记1----1.1 NoSQL是什么?
第一章 走进MongoDB 1.1NoSQL是什么? 1.1.1NoSQL简介 对于不了解NoSQL的人都会认为NoSQL为No SQL,即不是SQL.但是这种理解是错误的, ...
- Aerospike | Aerospike Chinese
Aerospike | Aerospike Chinese 如果您的企业依赖于: 庞大的数据量(超过任何结构化数据库所能处理的数据量) 可预见(且快速)的性能 透明的扩展 始终正常运行 那么您只有一个 ...
- 关于Mongodb的全面总结
MongoDB的内部构造<MongoDB The Definitive Guide> MongoDB的官方文档基本是how to do的介绍,而关于how it worked却少之又少,本 ...
- 从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据相关人才?
前段时间,跟候选人聊天的时候,一个有多年工作经验的资深 iOS 工程师告诉我,他最近正在学习 Machine Learning 相关的知识.他觉得,对于程序员来说,技术进步大大超过世人的想象,如果你不 ...
- Apache Sqoop - Overview——Sqoop 概述
Apache Sqoop - Overview Apache Sqoop 概述 使用Hadoop来分析和处理数据需要将数据加载到集群中并且将它和企业生产数据库中的其他数据进行结合处理.从生产系统加载大 ...
- Scala教程
Scala表示可扩展性语言,是一种混合函数式编程语言.它是由Martin Odersky创建,并于2003年首次发布. Scala平滑地集成面向对象和函数式语言的特点,并且Scala被编译在Java虚 ...
随机推荐
- 报表导出excel方式介绍
报表导出excel提供了四种方式,在单元格属性"其他/导出excel方式"可以选择,如下图 一是导出缺省值:报表中的单元格包含两个值,一个真实值一个显示值,但是在excel中 ...
- 在Fragment里面调用getActivity()报null
看友盟的错误日志发现又出现了NullPointerException,然后去看代码,发现只有是上下文有空的可能,但是因为以前已经发生过这种情况所以上下文我都是在创建Fragment对象的时候从Acti ...
- 网络 互联网接入方法、Mbit与MB的转换
ADSL:非对称数字用户环路(绝大多数家庭接入方法,使用电话线).可以提供最高1Mbps的上行速率和最高8Mbps的下行速率.最新的ADSL2+可以提供最高24Mbps的下行速率. 千千兆TB 千兆G ...
- 【Python】Java程序员学习Python(一)— 为什么学习Python
现在是6月份,毕业快3年了,虽然不能说对Java掌握的程度达到了如火纯青的地步,但是依然感觉到了瓶颈期,Java用的多了,也到了随心所欲的地步了,所以学第二门语言的想法一直在我脑海里闪现,有想法了就要 ...
- ES6中的import与export对class操作相关用法举例
两种用法: 一.指定输出类名 // export 输出 export class App extends React.Componet { // ..code } // import 引入 impor ...
- 查找并修复Android中的内存泄露—OutOfMemoryError
[编者按]本文作者为来自南非约翰内斯堡的女程序员 Rebecca Franks,Rebecca 热衷于安卓开发,拥有4年安卓应用开发经验.有点完美主义者,喜爱美食. 本文系国内ITOM管理平台 One ...
- Python学习---Django的request.post源码分析
request.post源码分析: 可以看到传递json后会帮我们dumps处理一次最后一字节形式传递过去
- 铁乐学Python_day10_函数2
今天书接昨天的函数继续去学习了解: 昨天说到函数的动态参数. 1.函数的[动态参数] *args 动态参数,万能参数 args接受的就是实参对应的所有剩余的位置参数,并将其放在元组( )中. def ...
- 生成器-yield初接触
什么是生成器? 生成器的实质就是迭代器 在python中有三种方式来获取生成器 1. 通过生成器函数 2. 通过各种推导式实现生成器 3. 通过数据的转换也可以获取生成器 将函数中的return换成y ...
- JavaScript数组方法的兼容性写法 汇总:indexOf()、forEach()、map()、filter()、some()、every()
ECMA Script5中数组方法如indexOf().forEach().map().filter().some()并不支持IE6-8,但是国内依然有一大部分用户使用IE6-8,而以上数组方法又确实 ...