3
这节主要讨论bgwriter进程到了BackgroundWriterMain,设置合适的信号处理句柄,创建一个资源属主以保持对本进程资源的跟踪,创建一个本进程的所有工作都在其内做的内存上下文"Background Writer",创建这个内存上下文是为了本进程在错误恢复期间能重置context并且因此避免可能的内存泄漏。设置错误跳跃点。接着不堵塞信号(当postmaster进程fork本进程时用PG_SETMASK(&BlockSig)堵塞了他们)。然后进入无限循环,检查并处理任何请求或者最近收到的信号。如果请求了检查点,就根据情况做一个重启点或做一个检查点;如果没请求检查点,就做一个脏缓存写。然后再接着循环。
4
下面是BackgroundWriterMain流程示意图。
BackgroundWriterMain流程示意图
BackgroundWriterMain中主要是根据情况看是否有创建检查点请求,如果有,再进一步根据情况判断是要做一个重启点还是要创建一个检查点,根据情况调用CreateCheckPoint或CreateRestartPoint方法;如果没有请求检查点,调用BgBuffferSync方法做脏缓存写。
5
其中CreateCheckPoint方法创建检查点的具体情况参见《Postgresql启动过程中的那些事十六:启动进程二》。创建重启点的CreateRestartPoint方法和创建检查点相似,但被用于WAL恢复期间创建一个点,如果重启,恢复可以从这个点继续前滚而不用重放整个恢复日志。
CreateRestartPoint流程示意图
创建重启点主要是为恢复重启保持一个合适的检查点,这个检查点必须是一个安全的重启点。如果可能创建一个重启点,创建重启点主要是把数据库系统共享内存中的数据全部刷出到磁盘,并把可以安全重启的检查点存入控制文件和共享内存中相关变量,详细信息参见上面的“CreateRestartPoint流程示意图”。
6
BgBuffferSync方法根据策略调用SyncOneBuffer把需要同步的脏缓存块逐个写出。pg里缓存池里的所有缓存块是由以Nbuffers个BufferDesc结构数组里的freeNext组成的空闲缓存链表和一个查找缓存的哈西表索引“SharedBuffer Lookup Table”(参见《Postgresql启动过程中的那些事七:shmem中初始化BufferPool》)进行管理。其中,SyncOneBuffer() -> FlushBuffer()-> smgrwrite(),在存储管理器smgr的smgrwrite方法里根据smgr的接口smgr_write和规则转到磁盘md的mdwrite方法。mdwrite方法不是同步写——在返回时块不是必须在磁盘上,其只是把这个缓存块的内容传到OS的kernel,最终调用OS的Write接口,kernel再根据情况安排写磁盘任务。但是,在下一次检查点记录到WAL日志前通过文件同步fsync我们将强制将这些改变的缓存块写到磁盘。
在BgBuffferSync方法里多次提到clocksweep算法,clocksweep算法是缓存池替换时使用的算法,其开始一个循环次数上限为tryCounter=NBuffers的循环来检查缓存池里的空闲缓存块,当找到一个引用计数refCount为0但最近使用过(usage_count不等于0)的缓存块时将usage_count减1,接着重新设置tryCounter=NBuffers并继续遍历,直到有缓存块的refCount和usage_count都为0,则其最近较少使用,可以被替换掉。