互联网背景下为什么会出现NoSQL
NoSQL泛指非关系型数据库。随着互联网行业的兴起与发展,传统的数据库结构已经很难适应大规模数据、非结构性数据带来的挑战,也就是现在大数据行业的发展对传统的数据库发出了挑战,而为了应对大规模的非结构性数据的处理,非关系型数据库才会在计算机、软件、数据库等方面得到飞速的发展。
创新互联长期为上1000家客户提供的网站建设服务,团队从业经验10年,关注不同地域、不同群体,并针对不同对象提供差异化的产品和服务;打造开放共赢平台,与合作伙伴共同营造健康的互联网生态环境。为德清企业提供专业的做网站、成都网站建设,德清网站改版等技术服务。拥有十年丰富建站经验和众多成功案例,为您定制开发。
有SQL数据库为什么还要有NoSQL
问题问得好,nosql的出现是在sql不能满足业务数据处理的前提下诞生的,
什么是NoSQL数据库?
2. 什么是NoSQL?
2.1 NoSQL 概述
NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”,
泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题,包括超大规模数据的存储。
(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。
2.2 NoSQL代表
MongDB、 Redis、Memcache
3. 关系型数据库与NoSQL的区别?
3.1 RDBMS
高度组织化结构化数据
结构化查询语言(SQL)
数据和关系都存储在单独的表中。
数据操纵语言,数据定义语言
严格的一致性
基础事务
ACID
关系型数据库遵循ACID规则
事务在英文中是transaction,和现实世界中的交易很类似,它有如下四个特性:
A (Atomicity) 原子性
原子性很容易理解,也就是说事务里的所有操作要么全部做完,要么都不做,事务成功的条件是事务里的所有操作都成功,只要有一个操作失败,整个事务就失败,需要回滚。比如银行转账,从A账户转100元至B账户,分为两个步骤:1)从A账户取100元;2)存入100元至B账户。这两步要么一起完成,要么一起不完成,如果只完成第一步,第二步失败,钱会莫名其妙少了100元。
C (Consistency) 一致性
一致性也比较容易理解,也就是说数据库要一直处于一致的状态,事务的运行不会改变数据库原本的一致性约束。
I (Isolation) 独立性
所谓的独立性是指并发的事务之间不会互相影响,如果一个事务要访问的数据正在被另外一个事务修改,只要另外一个事务未提交,它所访问的数据就不受未提交事务的影响。比如现有有个交易是从A账户转100元至B账户,在这个交易还未完成的情况下,如果此时B查询自己的账户,是看不到新增加的100元的
D (Durability) 持久性
持久性是指一旦事务提交后,它所做的修改将会永久的保存在数据库上,即使出现宕机也不会丢失。
3.2 NoSQL
代表着不仅仅是SQL
没有声明性查询语言
没有预定义的模式
键 - 值对存储,列存储,文档存储,图形数据库
最终一致性,而非ACID属性
非结构化和不可预知的数据
CAP定理
高性能,高可用性和可伸缩性
分布式数据库中的CAP原理(了解)
CAP定理:
Consistency(一致性), 数据一致更新,所有数据变动都是同步的
Availability(可用性), 好的响应性能
Partition tolerance(分区容错性) 可靠性
P: 系统中任意信息的丢失或失败不会影响系统的继续运作。
定理:任何分布式系统只可同时满足二点,没法三者兼顾。
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,
因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类:
CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
CP - 满足一致性,分区容忍性的系统,通常性能不是特别高。
AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。
CAP理论就是说在分布式存储系统中,最多只能实现上面的两点。
而由于当前的网络硬件肯定会出现延迟丢包等问题,所以分区容忍性是我们必须需要实现的。
所以我们只能在一致性和可用性之间进行权衡,没有NoSQL系统能同时保证这三点。
说明:C:强一致性 A:高可用性 P:分布式容忍性
举例:
CA:传统Oracle数据库
AP:大多数网站架构的选择
CP:Redis、Mongodb
注意:分布式架构的时候必须做出取舍。
一致性和可用性之间取一个平衡。多余大多数web应用,其实并不需要强一致性。
因此牺牲C换取P,这是目前分布式数据库产品的方向。
4. 当下NoSQL的经典应用
当下的应用是 SQL 与 NoSQL 一起使用的。
代表项目:阿里巴巴商品信息的存放。
去 IOE 化。
ps:I 是指 IBM 的小型机,很贵的,好像好几万一台;O 是指 Oracle 数据库,也很贵的,好几万呢;M 是指 EMC 的存储设备,也很贵的。
难点:
数据类型多样性。
数据源多样性和变化重构。
数据源改造而服务平台不需要大面积重构。
不懂NOSQL这些知识,怎么吹牛B
刚刚出现NOSQL这个概念的时候,很多人都是似而非的字面理解成”不是SQL”, 与传统的关系型数据库是两个完全独立的阵营,实际上完全不是这么回事。
个人更倾向于理解NOSQL的诞生更多的是为了补充关系型数据库的短板,满足现下互联网海量数据、高并发、低延迟和非结构化数据易扩展等需求。
newsql数据库支持结构化数据吗?
首先,来谈一下对数据库市场的看法,关系型数据库会一直占有主导地位。第一个原因是它的历史最久,有庞大的用户基础,根深。第二,SQL 的 query 在场景上依然是占主体的,尤其在数据分析上。 NoSQL的产生的是SQL对某些非关系为场景(KV点读)上的scalability 不好导致的。那个时候,主要问题是无法横向 scale,也就是没有分布式的支持,所以NoSQL 诞生了。而且KV, document 使用 normalized 数据结构也不利于理解和编程,所以可以看做是NoSQL 从SQL中抢了一些自己更适合的场景,所以它是在特定的时间和环境出现的一个产品。随着Distributed SQL 的出现, NoSQL 和 Distributed SQL 变得越来越像。未来几年有可能和 Distributed SQL 合并作为了一个产品类型。 NoSQL 在市场份额上不会超过或取代SQL, 在一些场景上会继续成长,尤其是用关系型数据集不好表达的,比如图。
今天 NewSQL 和 Distributed SQL 这2个名词在业界有一定的混淆。NewSQL 出现的早,可以被认为是Distributed SQL 的子集。以后还是以 Distributed SQL 为定义好。 所以你的问题其实是在 传统SQL,Distributed SQL 和 noSQL 之间如何选择。
答案是,最重要的指标是看用户的数据access的场景,和对应的数据结构。满足以下条件,更多考虑NoSQL:
数据之间没有关系,或者关系不强烈;每个row独立,row 之间不存在大规模的一对多,多对多的关系。
数据本身适合KV, 或者自我包含的hierachy关系。 比如个人profile, 完全自我contain, 人很人之间不需要query。
Access 数据的方式主要以 ID (primary key) 为主的点读,和顺序access (按顺序iterate)。
需要支持大规模的读写,低延时。
如果需要事务特性,范围限于一个或几个row, 没有关系型的事务。
使用 SQL 主要是因为 row 和 row 之间有关系; 存在一对多、多对多的关系。同时在关系的前提下,支持事务。支持table join的语法。对一致性要求高(强一致)。 Distributed SQL 提供了跨节点的分布式事务,query 等。但它是建立在牺牲性能的前提下的,延时大大价高。所以 NoSQL 是分布式+无关系,传统SQL 是 有关系+无分布式, Distributed SQL 是 分布式 + 有关系 + 性能取舍。
NewSQL 现在已经消退了,目前在国外退化为Distributed SQL原因如下:
卡耐基梅隆大学数据库教授Andy Pavlo,在文中系统地分析了NewSQL兴起到消亡的过程,给出了他认为NewSQL消亡的一些原因,比如:
1)没有开源。
2)没有拥抱公有云,在成本与技术上难与跟公有云厂商抗衡。
3)已有的关系型数据库MySQL,PostgreSQL做的不错,而且在不断改进,大部分客户数据并不多,单节点存储就能装下。
4)销售困难:客户担心切换风险,而且面临NoSQL在易用性方面的夹击。
另外,在谈到数据库发展趋势时,也提到NoSQL开始普遍支持SQL,joins和事务功能。到2021年后NewSQL概念除了中国的数据库创业公司,国外较少提了,更多地转向Distributed SQL。
NoSQL 和 关系型数据库,OLAP和OLTP的边界目前和未来会进一步模糊。市场的主要NoSQL产品开始普遍支持SQL,joins和事务功能,就我个人观点而言,NoSQL未来应该还是坚守初心——高并发,低延时,高伸缩性,对于关系型数据库擅长的 跨表Join, 跨机事务,AP等能力扩展应该谨慎些。产品选型时,最好也从这些方面多考虑些。
分享文章:nosql诞生是为了什么,nosql的概念
本文URL:http://scpingwu.com/article/hdsdep.html