Postgres-XL介绍

前端之家收集整理的这篇文章主要介绍了Postgres-XL介绍前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

什么是Postgres-XL

XL的意思是: eXtensible Lattice,可以扩展的格子,即将Postgresql应用在多机器上的分布式数据库的形象化表达.

Postgres-XL 是一个完全满足ACID的 开源的 可方便进行水平扩展的 多租户安全的 基于Postgresql数据库解决方案.

Postgres-XL 可非常灵活的应付各种负载,比如:

  • OLAP(通过MPP并行化)

  • OLTP

  • OLAP & OLTP

  • 操作数据存储

  • Key-value存储,包括JSON格式

不同的应用场景:

PGXL底层为Postgresql,这意味着它支持所有支持Postgressql类型的驱动,包括: JDBC,ODBC,OLE DB,Python,Ruby,perl DBI,Tcl,and Erlang.

Postgresql与Postgres-XL

  • 1994年,Postgre95发布,开源.

  • 1996年,Postgresql继承了Postgre95,发布.

  • 2010年,Postgres-XC发布.

  • 2012年,前PGXC核心开发者创建StormDB公司,进行了一些改进,包括对MPP并行化的性能改进和多租户安全.

  • 2013年,TransLattice收购了StormDB.

  • 2014年,将项目开源,命名为Postgres-XL.

Postgres-XC与Postgres-XL

PGXL的架构师和开发者 很多都是以前做PGXC的,PGXL的部分代码是从PGXC移植过来的.

比起功能性,PGXL更强调稳定性,正确性和性能.

PGXL 增加了一些重要的性能提升,比如MPP和 replan avoidance on the data nodes,这些都是PGXC没有的.

PGXC目前集中在OLTP的业务上面,PGXL则更加灵活,可以应用于很多不同种类的业务上,比如可以用在大数据处理领域,除此,在多租户的环境中,PGXL也更加安全.

PGXL的社区非常开放.

PGXL架构基本知识

PGXL是一系列Postgresql数据库的集群,在上层看来就像使用一个数据库一样.根据设计方案的不同,每张表可以是replicated或是distributed的形式.

PGXL有三个主要组件,分别是GTM,Coordinator和Datanode.

GTM(Gloable Transaction Manager)负责提供事务的ACID属性;
Datanode负责存储表的数据和本地执行由Coordinator派发的sql任务;
Coordinator负责处理每个来自Application的sql任务,并且决定由哪个Datanode执行,然后将任务计划派发给相应的Datanode,根据需要收集结果返还给Application;
pgxl architecture

GTM 通常由一台独立的服务器承担,因为GTM需要处理来自所有Coordinator 和 Datanode的事务请求.为了将 Coordinator 和Datanode 上进程的请求和响应聚集到一台机器上,可以配置GTM-Proxy. GTM-Proxy 会减少 GTM 的负载,同时会帮助处理GTM失效的情况.即便如此,GTM 还是可能会发生单点失效问题,这时可以配置一个 GTM-Standby 节点作为 GTM 的备用节点.

每台机器最好同时配置一个 Coordinator 和一个 Datanode,这样既不用担心二者的负载均衡,而且可以降低网络流量.

如何实现High Availability

可以对每个节点增加slave,就类似 Postgresql 的 streaming replication一样.

GTM 可以有一个 GTM Standby.

针对自动的 failover,目前可以使用 Corosync/Pacemaker,虽然它们现在还不是核心项目.

PGXL的license

PGXL 和 Postgresql 使用相同的 LICENSE,截止到2015年,使用的还是 Mozilla Public License.

猜你在找的程序笔记相关文章