什么是Postgres-XL
XL的意思是: eXtensible Lattice
,可以扩展的格子,即将Postgresql
应用在多机器上的分布式数据库的形象化表达.
Postgres-XL
是一个完全满足ACID的 开源的 可方便进行水平扩展的 多租户安全的 基于Postgresql的数据库解决方案.
Postgres-XL 可非常灵活的应付各种负载,比如:
OLAP(通过MPP并行化)
OLTP
OLAP & OLTP
操作数据存储
Key-value存储,包括JSON格式
不同的应用场景:
PGXL底层为Postgresql,这意味着它支持所有支持Postgressql类型的驱动,包括: JDBC,ODBC,OLE DB,Python,Ruby,perl DBI,Tcl,and Erlang.
Postgresql与Postgres-XL
1994年,Postgre95发布,开源.
1996年,Postgresql继承了Postgre95,发布.
2010年,Postgres-XC发布.
2013年,TransLattice收购了StormDB.
2014年,将项目开源,命名为Postgres-XL.
Postgres-XC与Postgres-XL
PGXL的架构师和开发者 很多都是以前做PGXC的,PGXL的部分代码是从PGXC移植过来的.
PGXL 增加了一些重要的性能提升,比如MPP和 replan avoidance on the data nodes,这些都是PGXC没有的.
PGXC目前集中在OLTP的业务上面,PGXL则更加灵活,可以应用于很多不同种类的业务上,比如可以用在大数据处理领域,除此,在多租户的环境中,PGXL也更加安全.
PGXL的社区非常开放.
PGXL架构基本知识
PGXL是一系列Postgresql数据库的集群,在上层看来就像使用一个数据库一样.根据设计方案的不同,每张表可以是replicated或是distributed的形式.
PGXL有三个主要组件,分别是GTM,Coordinator和Datanode.
GTM(Gloable Transaction Manager)负责提供事务的ACID属性;
Datanode负责存储表的数据和本地执行由Coordinator派发的sql任务;
Coordinator负责处理每个来自Application的sql任务,并且决定由哪个Datanode执行,然后将任务计划派发给相应的Datanode,根据需要收集结果返还给Application;
pgxl architecture
GTM 通常由一台独立的服务器承担,因为GTM需要处理来自所有Coordinator 和 Datanode的事务请求.为了将 Coordinator 和Datanode 上进程的请求和响应聚集到一台机器上,可以配置GTM-Proxy. GTM-Proxy 会减少 GTM 的负载,同时会帮助处理GTM失效的情况.即便如此,GTM 还是可能会发生单点失效问题,这时可以配置一个 GTM-Standby 节点作为 GTM 的备用节点.
每台机器最好同时配置一个 Coordinator 和一个 Datanode,这样既不用担心二者的负载均衡,而且可以降低网络流量.
如何实现High Availability
可以对每个节点增加slave,就类似 Postgresql 的 streaming replication一样.
GTM 可以有一个 GTM Standby.
针对自动的 failover,目前可以使用 Corosync/Pacemaker,虽然它们现在还不是核心项目.
PGXL的license
PGXL 和 Postgresql 使用相同的 LICENSE,截止到2015年,使用的还是 Mozilla Public License.