如果你关注大数据科技动向,你对 NoSQL 一定不陌生,NoSQL 是一个分布式数据库。在过去时间,数据存储一直关系型数据库天下,有着良好的控制并发操作、事务功能。虽然RDBMS很优秀,但是随着时间的推移就出现了两个关系数据库解决不了的问题:快速增长的数据规模和日渐复杂的数据模型。结果,我们看到了 NoSQL 数据库的兴起。

一、关系数据库不足

实际上,从 1979 年 Oracle 发布了第一个版本,这些数据库被设计为在单个服务器上运行,并且越大越好。而且增加这些数据库容量的唯一方法是升级服务器处理器、内存和存储,数据存储代价不断升高。随着互联网的数据呈指数级增长和 Web 应用程序的兴起,数据模型日渐复杂,关系数据库难以支撑,NoSQL 数据库也由此孕育而生。在 2006 年谷歌发布了 Bigtable 研究论文,在 2007 年亚马逊发布了 Dynamo 研究论文。而这些新的数据库旨在满足新一代企业要求:需要敏捷开发并支持任意规模运作。

二、敏捷开发

当今是以体验为中心的数字经济,企业如何保持竞争力,那么必须进行创新。由于这项创新的核心是现代 Web、移动和物联网应用程序的开发,因此开发人员必须高频提供应用程序和服务。速度和敏捷性都至关重要,因为这些应用程序的发展速度远远超过 ERP 等传统应用程序。而关系数据库是却不能很好满足于它,因为它们的固定数据模型不能很好地支持敏捷开发。

敏捷开发的核心原则是适应不断变化的应用程序需求:当需求发生变化时,数据模型也会发生变化,这是关系数据库的难以克服的问题,因为关系数据库的模型是固定的,并预先定义好的。因此,当要更改数据模型,开发人员不得不修改当初设定好的数据库结构,以适应新的需求。这会减慢或停止开发,不仅因为它是一个手动,耗时的过程,而且还会影响其他应用程序和服务。

相比之下,NoSQL 文档 数据库完全完美支持这点,因为它是无模式的,没有强制定义数据必须建模。相反,它遵循应用程序和服务。使用 NoSQL,数据模型由应用程序模型定义。应用程序和服务将数据建模作为对象。

三、如何支持任意规模运作

为了支持以指数增长的用户和数据 - 数百到数千到数百万用户,以及千兆字节到数TB的数据操作,应用程序和服务不得不进行扩展以保持性能,并且必须有效地运行。

对于扩展关系数据库而言,这是一个问题,例如,使用 Oracle ,使用 RAC 技术进行扩展就需要大量组件,昂贵且不完全可靠。因此,有效扩展和按需扩展的能力是一项挑战。它会变得越来越昂贵,因为必须购买更大更强的服务器以容纳更多用户和更多数据。此外,如果必须使数据库脱机以执行硬件升级,则可能导致停机。

然而,分布式 NoSQL 数据库利用廉价硬件进行扩展, 只需添加更多服务器即可添加更多资源。扩展能力使企业能够通过以下方式更有效地扩展:

1、不需要为满足部署而买相对称的硬件

2、利用较便宜的硬件进行拓展;

3、按需扩展,无需停机。

四、NoSQL 常见存储方式

NoSQL 常见有三种存储方式:键值存储、面向文档的数据库和面向列的数据库。接下来说明这几种存储方式以及数据库代表。

键值存储

代表:Redis、memcached

键值存储是 NoSQL 最常见存储方式,通过 key-value 形式保存数据,高速访问数据。而且根据保存时效也分为临时性、永久性和两者兼备。

面向文档的数据库

代表:MongoDB、CouchDB

面向文档的数据库数据结构要求不是很严格,不定义表结构而且可以使用复杂的查询条件

面向列的数据库

代表:HBase

面向列的数据库以列为单位进行存储,这里的列式存储其实说的是列族存储,它将数据表存储为数据列而非行的形式。列族存储优势:快速查询,易拓展,但功能相对局限。

五、NoSQL 对于事务的支持?

在这里有一个误区,由于分布式事务需要分布式协作,所以似乎必须在性能可扩展性和分布式事务支持之间进行权衡。

耶鲁大学的一名副教授 Daniel Abadi 认为这个想法是错的,可拓展的分布式系统也是可以实现事物。他提出了一个新的权衡策略,具体是在公平性、隔离性和吞吐量(FIT)三者之间进行取舍。
换句话说,有两种方法构建出具备分布式事务吞吐量的可扩展系统:

1、放弃隔离性

当放弃隔离性,一个事物是不会跟其他事物有冲突,就无需等待协作就可以完成了。而且也有一类数据约束可以确保在弱隔离下正确性。

2、放弃公平性

通过设定分布式协作的顺序最小化两者之间的时间重叠,从而减轻二者之间的相互影响,在此公平下找到最合适时间进行协作。

六、小结

构建和运行这些大规模交互式应用程序创建了一组新的技术要求。新的技术架构需要比以往更加灵活,并且需要一种能够适应前所未有的规模、速度和数据可变性的实时数据管理方法。关系数据库无法满足这些新要求,这就使得 NoSQL 逐渐流行起来。

为什么企业依赖于 NoSQL的更多相关文章

  1. 译:为什么使用 NoSQL 数据库

    原文链接:Why NoSQL Database? 向数据时代的转变正在推动 NoSQL 随着各行各业朝着数据时代转变,商业世界正在经历巨大的变革.这是由互联网以及其他二十一世纪新技术--云计算.移动应 ...

  2. SQL与NoSQL(关系型与非关系型)数据库的区别

    永远正确的经典答案依然是:具体问题具体分析. 数据表VS.数据集 关系型和非关系型数据库的主要差异是数据存储的方式.关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储, ...

  3. SQL VS NoSQL

    (关系型与非关系型)数据库的区别: 关系型和非关系型数据库的主要差异是数据存储的方式 1.1 数据表 VS 数据集 关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储, ...

  4. MongoDB自学笔记1----1.1 NoSQL是什么?

    第一章 走进MongoDB 1.1NoSQL是什么?       1.1.1NoSQL简介        对于不了解NoSQL的人都会认为NoSQL为No SQL,即不是SQL.但是这种理解是错误的, ...

  5. Aerospike | Aerospike Chinese

    Aerospike | Aerospike Chinese 如果您的企业依赖于: 庞大的数据量(超过任何结构化数据库所能处理的数据量) 可预见(且快速)的性能 透明的扩展 始终正常运行 那么您只有一个 ...

  6. 关于Mongodb的全面总结

    MongoDB的内部构造<MongoDB The Definitive Guide> MongoDB的官方文档基本是how to do的介绍,而关于how it worked却少之又少,本 ...

  7. 从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据相关人才?

    前段时间,跟候选人聊天的时候,一个有多年工作经验的资深 iOS 工程师告诉我,他最近正在学习 Machine Learning 相关的知识.他觉得,对于程序员来说,技术进步大大超过世人的想象,如果你不 ...

  8. Apache Sqoop - Overview——Sqoop 概述

    Apache Sqoop - Overview Apache Sqoop 概述 使用Hadoop来分析和处理数据需要将数据加载到集群中并且将它和企业生产数据库中的其他数据进行结合处理.从生产系统加载大 ...

  9. Scala教程

    Scala表示可扩展性语言,是一种混合函数式编程语言.它是由Martin Odersky创建,并于2003年首次发布. Scala平滑地集成面向对象和函数式语言的特点,并且Scala被编译在Java虚 ...

随机推荐

  1. jQuery实现大图轮播

    css样式: *{    margin: 0;    padding: 0;}ul{    list-style:none;}.slideShow{    width: 620px;    heigh ...

  2. arcgis 加载高德地图 es6的方式

    目前很多arcgis 加载高德地图是dojo的方式 外部引入文件,现在改成这种方式 /** * Created by Administrator on 2018/5/14 0014. */ impor ...

  3. android IO流操作文件(存储和读取)

    存储文件: public class FileOperate extends Activity { private static final String FILENAME = "mydat ...

  4. 分布式部署下的报表调用 API调用 权限问题以及性能方案

     背景描述: 客户的实际情况是需要在具体系统构架前,通过与厂商讨论确定最终的系统架构方案. 需求是客户自己有管理系统,希望建立一个独立的报表服务器,该报表服务器可以对多个管理系统提供报表服务,不知 ...

  5. 2cmd 窗口 javac 错误:编码GBK的不可映射字符

    错误截图: 解决办法:第一步 第二步:

  6. 读写JSON作配置文件

    个人不太喜欢XML,于是找了JSON来做配置,JSON虽然有很多引号,但这种key-value的形式,非常符合我的思维,就像是一个萝卜一个坑.最近在读写JSON文件,需要注意两个问题. 中文乱码: 直 ...

  7. 为何说 JavaScript 开发很疯狂

    [编者按]本文作者为 Sean Fioritto,主要阐述了 JavaScript 开发为何让人有些无从下手的根本原因.文章系国内 ITOM 管理平台 OneAPM 编译呈现. 网络开发乐趣多多!Ja ...

  8. H5 高德地图获取当前位置信息

    返回结果:jsonp_393330_({"status":"1","info":"OK","infocode& ...

  9. [CENTOS7] [IPTABLES] 卸载Firewall Id安装 IPTABLES及防火墙设置

    卸载Firewall ID,重装IPTABLES:先停止服务 systemctl stop firewalldsystemctl mask firewalld   yum install iptabl ...

  10. [转]CentOS7增加或修改SSH端口号

    前言:开启某服务或软件的端口,要从该服务或软件监听的端口(多以修改配置文件为主),SeLinux和防火墙(FireWall)的安全策略下手.如果使用阿里云,腾讯等第三方服务器还需要对管理控制台的安全组 ...