是涉及到内部结构方面的内容,都比较抽象,但是事物的结构往往决定事物的性质,要想更本质的认识mongodb,那就慢慢啃吧!
废话少说,步入正题:
MongoDB 是一个可移植的数据库,它在流行的每一个平台上都可以使用,即所谓的跨平台特性。
一个运行着的MongoDB 数据库就可以看成是一个MongoDB Server,该Server 由实例和数据库组成,在一般的情况下一个MongoDB Server 机器上包含一个实例和多个与之对应的数据库,但是在特殊情况下,如硬件投入成本有限或特殊的应用需求,也允许一个Server 机器上可以有多个实例和多个数据库。
MongoDB 中一系列物理文件(数据文件,日志文件等)的集合或与之对应的逻辑结构(集合,文档等)被称为数据库,简单的说,就是数据库是由一系列与磁盘有关系的物理文件的组成。
体系结构具体分为:逻辑结构和存储结构。
逻辑结构不难理解。
MongoDB 的逻辑结构是一种层次结构。主要由:文档(document)、集合(collection)、数据库(database)这三部分组成的。逻辑结构是面向用户的,用户使用MongoDB 开发应用程序使用的就是逻辑结构。
MongoDB 的文档(document),相当于关系数据库中的一行记录。
多个文档组成一个集合(collection),相当于关系数据库的表。
多个集合(collection),逻辑上组织在一起,就是数据库(database)。
一个MongoDB 实例支持多个数据库(database)。
一张非常形象的mongodb与关系型数据库对比表:
存储结构,这部分既是重点也是难点,因为很抽象!
MongoDB 的默认数据目录是/usr/local/mongodb/data,它负责存储所有的MongoDB 的数据文件。在MongoDB内部,每个数据库都包含一个.ns 文件和一些数据文件,而且这些数据文件会随着数据量的增加而变得越来越多。所以如果系统中有一个叫做foo 的数据库,那么构成foo 这个数据库的文件就会由foo.ns,foo.0,foo.1,foo.2。大家可以打开自己安装mongodb时的数据库文件夹,里头就是这些文件,新建一个数据库,就会产生相应的一组以数据库命名的数据文件,并且本人也动手试过,foo.2大小是foo.1的两倍,foo.1大小是foo.0的两倍。
MongoDB 内部有预分配空间的机制,每个预分配的文件都用0 进行填充,由于有了这个机制,MongoDB 始终保持额外的空间和空余的数据文件,从而有效避免了由于数据暴增而带来的磁盘压力过大的问题。
由于表中数据量的增加,数据文件每新分配一次,它的大小都会是上一个数据文件大小的2倍,每个数据文件最大2G。这样的机制有利于防止较小的数据库浪费过多的磁盘空间,同时又能保证较大的数据库有相应的预留空间使用。
数据库的每张表都对应一个命名空间,每个索引也有对应的命名空间。这些命名空间的元数据都集中在*.ns 文件中。
在下图中,foo 这个数据库包含3 个文件用于存储表和索引数据,foo.2 文件属于预分配的空文件。foo.0 和foo.1 这两个数据文件被分为了相应的盘区对应不同的名字空间。
上图显示了命名空间和盘区的关系。每个命名空间可以包含多个不同的盘区,这些盘区并不是连续的。与数据文件的增长相同,每一个命名空间对应的盘区大小的也是随着分配的次数不断增长的。这样做的目的是为了平衡命名空间浪费的空间与保持某一个命名空间中数据的连续性。上图中还有一个需要注意的命名空间:$freelist,这个命名空间用于记录不再使用的盘区(被删除的Collection 或索引)。每当命名空间需要分配新的盘区的时候,都会先查看$freelist 是否有大小合适的盘区可以使用,这样就回收空闲的磁盘空间。