RDBMS
- 高度组织化结构化数据
- 结构化查询语言(sql) (sql)
- 数据和关系都存储在单独的表中。
- 数据操纵语言,数据定义语言
- 严格的一致性
- 基础事务
Nosql
- 代表着不仅仅是sql
- 没有声明性查询语言
- 没有预定义的模式
-键 - 值对存储,列存储,文档存储,图形数据库
- 最终一致性,而非ACID属性
- 非结构化和不可预知的数据
- CAP定理
- 高性能,高可用性和可伸缩性
ACID
在传数据库系统中,事务具有ACID 4个属性
(1)原子性(Atomicity):事务是一个原子操作单元,其对数据的修改,要么全都执行,要么全都不执行。
(2)一致性(Consistent):在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构(如B树索引或双向链表)也都必须是正确的。
(3)隔离性(Isolation):数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的“独立”环境执行。这意味着事务处理过程中的中间状态对外部是不可见的,反之亦然。
(4)持久性(Durable):事务完成之后,它对于数据的修改是永久性的,即使出现系统故障也能够保持。
对于单个节点的事务,数据库都是通过并发控制和恢复机制(日志技术)保证事务的ACID特性。对于跨多个节点的分布式事务,通过两阶段提交协议来保证事务的ACID。
CAP定理(CAP theorem)
在计算机科学中,CAP定理(CAP theorem),又被称作 布鲁尔定理(Brewer’s theorem),它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
● 一致性(Consistency) (所有节点在同一时间具有相同的数据)
● 可用性(Availability) (保证每个请求不管成功或者失败都有响应)
● 分隔容忍(Partition tolerance) (系统中任意信息的丢失或失败不会影响系统的继续运作)
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
因此,根据 CAP 原理将 Nosql 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类:
● CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
● CP - 满足一致性,分区容忍性的系统,通常性能不是特别高。
● AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。
Nosql的优点/缺点
优点:
● - 高可扩展性
● - 分布式计算
● - 低成本
● - 架构的灵活性,半结构化数据
● - 没有复杂的关系
缺点:
● - 没有标准化
● - 有限的查询功能(到目前为止)
● - 最终一致是不直观的程序
BASE
BASE:Basically Available,Soft-state,Eventually Consistent。 由 Eric Brewer 定义。
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
BASE是Nosql数据库通常对可用性及一致性的弱要求原则:
● Basically Availble –基本可用
● Soft-state –软状态/柔性事务。 “Soft state” 可以理解为”无连接”的,而 “Hard state” 是”面向连接”的
● Eventual Consistency –最终一致性 最终一致性, 也是是 ACID 的最终目的。
ACID vs BASE
ACID | BASE |
---|---|
原子性(Atomicity) | 基本可用(Basically Available) |
一致性(Consistency) | 软状态/柔性事务(Soft state) |
隔离性(Isolation) | 最终一致性 (Eventual consistency) |
持久性 (Durable) |