我已经能够找到有关如何设置以及它的功能的信息.但是,我很难找到一个关于它如何实际工作的详细技术文档(例如,使用keepalived,有文档可以解释心跳包的发送频率,它们的外观等等).
我知道这是一个非常广泛的问题,但我希望能够很好地理解这个功能的机制.
> The Design and Architecture of the Microsoft Cluster Service – 本文由我的一位CompSci英雄Jim Gray(RIP,Jim)共同撰写,发表于1998年IEEE FTe论文集,描述了Microsoft Cluster Server产品的基本设计,就像在Windows NT 4.0中一样,后来的产品都是从哪些产品发展而来的.这里甚至还有一个流程图,尽管它可能与当前几代产品相比已经过时了.
> Network failure detection and recovery in a two-node Windows Server 2000 cluster – 本文虽然过时,但确实描述了用于确定群集中节点的网络可用性的状态机的低级细节.
> [MS-CMRP]: Failover Cluster: Management API (ClusAPI) Protocol Specification – 本文档声明产品如何在内部工作,认为其目的不是专门记录集群内通信协议和流程.
>此功能在产品的更高版本中得到了更多配置. Searching for the name of the command-line management tool,cluster.exe
,and the word “heartbeat” targeted against Microsoft’s site似乎给出了很多潜在的好结果(one of the first hits I found有一段包含短语“……这里每个节点在每个集群网络上都有一个接口,每1.2秒每个网络发送N *(N-1)个单播心跳……“,听起来就像你正在寻找的东西 – 虽然描述的是Windows Server 2003.)
而且,当然,如果你想看到更多的低级别自己设置它并扔掉它的嗅探器.