我们今天收到了客户的一个有趣的“要求”.
他们希望在Web应用程序上进行异地故障转移,从而实现100%的正常运行时间.从我们的Web应用程序的角度来看,这不是问题.它旨在能够跨多个数据库服务器等扩展.
但是,从网络问题来看,我似乎无法弄清楚如何使其工作.
简而言之,该应用程序将存在于客户端网络中的服务器上.内部和外部人员都可以访问它.他们希望我们维护系统的非现场副本,如果在他们的场所发生严重故障,他们会立即接收并接管.
现在我们知道绝对没有办法解决内部人员(载体鸽?),但是他们希望外部用户甚至不会注意到.
坦率地说,我对于如何做到这一点并不是最模糊的想法.似乎如果他们失去互联网连接,那么我们将不得不进行DNS更改以将流量转发到外部机器……当然,这需要时间.
想法?
UPDATE
我今天与客户进行了讨论,他们澄清了这个问题.
他们坚持100%的数字,说应用程序应该保持活跃,即使在洪水的情况下.但是,如果我们为它们托管它,那个要求才会开始.他们说,如果应用程序完全在他们的服务器上运行,他们将处理正常运行时间要求你可以猜到我的回答.
这是
Wikipedia追求9的方便图表:
有趣的是,2007年只有3 of the top 20 websites能够实现神话般的5个9或99.999%的正常运行时间.它们分别是雅虎,美国在线和康卡斯特.在2008年的前4个月中,有些最多的是popular social networks,甚至没有接近这一点.
从图表中可以看出,追求100%正常运行时间是多么荒谬……