原文地址:http://www.infoq.com/cn/news/2011/02/nosql-architecture-practice/
- 前面《为什么要使用NoSQL》和《关系数据库还是NoSQL数据库》两篇从大体上介绍了为什么要用Nosql,何时该用Nosql。经常有朋友遇到困惑,看到Nosql的介绍,觉得很好,但是却不知道如何正式用到自己的项目中。很大的原因就是思维固定在MysqL中了,他们问得最多的问题就是用了Nosql,我如何做关系查询。那么接下来,我们看下怎么样在我们的系统中使用Nosql。
- 怎么样把Nosql引入到我们的系统架构设计中,需要根据我们系统的业务场景来分析,什么样类型的数据适合存储在Nosql数据库中,什么样类型的数据必须使用关系数据库存储。明确引入的Nosql数据库带给系统的作用,它能解决什么问题,以及可能带来的新的问题。下面我们分析几种常见的Nosql架构。
(一)Nosql作为镜像
- 如果有数据一致性要求,可以像如下的方式使用
<code class="hljs objectivec has-numbering" style="display: block; padding: 0px; color: inherit; Box-sizing: border-Box; font-family: 'Source Code Pro',monospace;font-size:undefined; white-space: pre; border-radius: 0px; word-wrap: normal; background: transparent;"><span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//写入数据的示例伪代码 </span> <span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//data为我们要存储的数据对象 </span> <span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">bool</span> status=<span class="hljs-literal" style="color: rgb(0,102,102); Box-sizing: border-Box;">false</span>; DB<span class="hljs-variable" style="color: rgb(102,102); Box-sizing: border-Box;">.startTransaction</span>();<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//开始事务 </span> <span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">id</span>=DB<span class="hljs-variable" style="color: rgb(102,102); Box-sizing: border-Box;">.Insert</span>(data);<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//写入MysqL数据库 </span> <span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">if</span>(<span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">id</span>><span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">0</span>){ status=Nosql<span class="hljs-variable" style="color: rgb(102,102); Box-sizing: border-Box;">.Add</span>(<span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">id</span>,data);<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//以写入MysqL产生的自增id为主键写入Nosql数据库 </span> } <span class="hljs-keyword" style="color: rgb(0,102); Box-sizing: border-Box;">0</span> && status==<span class="hljs-literal" style="color: rgb(0,102); Box-sizing: border-Box;">true</span>){ DB<span class="hljs-variable" style="color: rgb(102,102); Box-sizing: border-Box;">.commit</span>();<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//提交事务 </span> }<span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">else</span>{ DB<span class="hljs-variable" style="color: rgb(102,102); Box-sizing: border-Box;">.rollback</span>();<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//不成功,进行回滚 </span> }</code><ul class="pre-numbering" style="Box-sizing: border-Box; position: absolute; width: 50px; top: 0px; left: 0px; margin: 0px; padding: 6px 0px 40px; border-right-width: 1px; border-right-style: solid; border-right-color: rgb(221,238);"><li style="Box-sizing: border-Box; padding: 0px 5px;">1</li><li style="Box-sizing: border-Box; padding: 0px 5px;">2</li><li style="Box-sizing: border-Box; padding: 0px 5px;">3</li><li style="Box-sizing: border-Box; padding: 0px 5px;">4</li><li style="Box-sizing: border-Box; padding: 0px 5px;">5</li><li style="Box-sizing: border-Box; padding: 0px 5px;">6</li><li style="Box-sizing: border-Box; padding: 0px 5px;">7</li><li style="Box-sizing: border-Box; padding: 0px 5px;">8</li><li style="Box-sizing: border-Box; padding: 0px 5px;">9</li><li style="Box-sizing: border-Box; padding: 0px 5px;">10</li><li style="Box-sizing: border-Box; padding: 0px 5px;">11</li><li style="Box-sizing: border-Box; padding: 0px 5px;">12</li><li style="Box-sizing: border-Box; padding: 0px 5px;">13</li></ul>
-
上面的代码看起来可能觉得有点麻烦,但是只需要在DB类或者ORM层做一个统一的封装,就能实现重用了,其他代码都不用做任何的修改。
-
这种架构在原有基于MysqL数据库的架构上增加了一层辅助的Nosql存储,代码量不大,技术难度小,却在可扩展性和性能上起到了非常大的作用。只需要程序在写入MysqL数据库后,同时写入到Nosql数据库,让MysqL和Nosql拥有相同的镜像数据,在某些可以根据主键查询的地方,使用高效的Nosql数据库查询,这样就节省了MysqL的查询,用Nosql的高性能来抵挡这些查询。
图 2 -Nosql为镜像(同步模式) -
这种不通过程序代码,而是通过MysqL把数据同步到Nosql中,这种模式是上面一种的变体,是一种对写入透明但是具有更高技术难度一种模式。这种模式适用于现有的比较复杂的老系统,通过修改代码不易实现,可能引起新的问题。同时也适用于需要把数据同步到多种类型的存储中。
-
MysqL到Nosql同步的实现可以使用MysqL UDF函数,MysqL binlog的解析来实现。可以利用现有的开源项目来实现,比如:
- MysqL memcached UDFs:从通过UDF操作Memcached协议。
- 国内张宴开源的mysql-udf-http:通过UDF操作http协议。
- 有了这两个MysqL UDF函数库,我们就能通过MysqL透明的处理Memcached或者Http协议,这样只要有兼容Memcached或者Http协议的Nosql数据库,那么我们就能通过MysqL去操作以进行同步数据。再结合lib_MysqLudf_json,通过UDF和MysqL触发器功能的结合,就可以实现数据的自动同步。
(二)MysqL和Nosql组合
<code class="hljs lasso has-numbering" style="display: block; padding: 0px; color: inherit; Box-sizing: border-Box; font-family: 'Source Code Pro',0); Box-sizing: border-Box;">//写入数据的示例伪代码 </span> <span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//data为我们要存储的数据对象 </span> <span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">data</span><span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>title<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span>”title”; <span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>name<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span>”name”; <span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>time<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span>”<span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">2009</span><span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">-</span><span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">12</span><span class="hljs-subst" style="color: rgb(0,102); Box-sizing: border-Box;">01</span> <span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">10</span>:<span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">01</span>”; <span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>from<span class="hljs-subst" style="color: rgb(0,102); Box-sizing: border-Box;">1</span>”; bool status<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span><span class="hljs-literal" style="color: rgb(0,102); Box-sizing: border-Box;">false</span>; DB<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>startTransaction();<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//开始事务 </span> id<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span>DB<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>Insert(“INSERT <span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">INTO</span> table (from) VALUES(<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>from)”);<span class="hljs-comment" style="color: rgb(136,0); Box-sizing: border-Box;">//写入MysqL数据库,只写from需要where查询的字段 </span> <span class="hljs-keyword" style="color: rgb(0,136); Box-sizing: border-Box;">if</span>(id<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">></span><span class="hljs-number" style="color: rgb(0,102); Box-sizing: border-Box;">0</span>){ status<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">=</span>Nosql<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>Add(id,<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">data</span>);<span class="hljs-comment" style="color: rgb(136,102); Box-sizing: border-Box;">0</span> <span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">&&</span> status<span class="hljs-subst" style="color: rgb(0,0); Box-sizing: border-Box;">==</span><span class="hljs-literal" style="color: rgb(0,102); Box-sizing: border-Box;">true</span>){ DB<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>commit();<span class="hljs-comment" style="color: rgb(136,136); Box-sizing: border-Box;">else</span>{ DB<span class="hljs-built_in" style="color: rgb(102,102); Box-sizing: border-Box;">.</span>rollback();<span class="hljs-comment" style="color: rgb(136,238);"><li style="Box-sizing: border-Box; padding: 0px 5px;">1</li><li style="Box-sizing: border-Box; padding: 0px 5px;">2</li><li style="Box-sizing: border-Box; padding: 0px 5px;">3</li><li style="Box-sizing: border-Box; padding: 0px 5px;">4</li><li style="Box-sizing: border-Box; padding: 0px 5px;">5</li><li style="Box-sizing: border-Box; padding: 0px 5px;">6</li><li style="Box-sizing: border-Box; padding: 0px 5px;">7</li><li style="Box-sizing: border-Box; padding: 0px 5px;">8</li><li style="Box-sizing: border-Box; padding: 0px 5px;">9</li><li style="Box-sizing: border-Box; padding: 0px 5px;">10</li><li style="Box-sizing: border-Box; padding: 0px 5px;">11</li><li style="Box-sizing: border-Box; padding: 0px 5px;">12</li><li style="Box-sizing: border-Box; padding: 0px 5px;">13</li><li style="Box-sizing: border-Box; padding: 0px 5px;">14</li><li style="Box-sizing: border-Box; padding: 0px 5px;">15</li><li style="Box-sizing: border-Box; padding: 0px 5px;">16</li><li style="Box-sizing: border-Box; padding: 0px 5px;">17</li><li style="Box-sizing: border-Box; padding: 0px 5px;">18</li></ul>
-
把需要查询的字段,一般都是数字,时间等类型的小字段存储于MysqL中,根据查询建立相应的索引,其他不需要的字段,包括大文本字段都存储在Nosql中。在查询的时候,我们先从MysqL中查询出数据的主键,然后从Nosql中直接取出对应的数据即可。
-
这种架构模式把MysqL和Nosql的作用进行了融合,各司其职,让MysqL专门负责处理擅长的关系存储,Nosql作为数据的存储。它有以下优点:
- 节省MysqL的IO开销。由于MysqL只存储需要查询的小字段,不再负责存储大文本字段,这样就可以节省MysqL存储的空间开销,从而节省MysqL的磁盘IO。我们曾经通过这种优化,把MysqL一个40G的表缩减到几百M。
- 提高MysqL Query Cache缓存命中率。我们知道query cache缓存失效是表级的,在MysqL表一旦被更新就会失效,经过这种字段的分离,更新的字段如果不是存储在MysqL中,那么对query cache就没有任何影响。而Nosql的Cache往往都是行级别的,只对更新的记录的缓存失效。
- 提升MysqL主从同步效率。由于MysqL存储空间的减小,同步的数据记录也减小了,而部分数据的更新落在Nosql而不是MysqL,这样也减少了MysqL数据需要同步的次数。
- 提高MysqL数据备份和恢复的速度。由于MysqL数据库存储的数据的减小,很容易看到数据备份和恢复的速度也将极大的提高。
比以前更容易扩展。Nosql天生就容易扩展。经过这种优化,MysqL性能也得到提高。
- 比如手机凤凰网就是这种架构 :http://www.cnblogs.com/sunli/archive/2010/12/20/imcp.html