对不起这么高级别的问题.我理解服务器负载平衡的基础知识,但管理30,000台服务器的概念对我来说有点陌生.是否真的只是平衡2或3台服务器的概念,扩展了10,000倍?
这与memcached,sql / mysql,搜索引擎等有什么关系?
它是一个层次系统,让“控制器”服务器和从属服务器基于此提供数据吗?如何处理冗余?
感谢有关此事的文章的任何信息或指示.
编辑感谢回复家伙.我的帖子已经关闭了,但我已经修改了标题,希望它会重新打开,因为我发现这些超高级数据解决方案涉及的问题解决过程很有吸引力,而且我目前正在构建一个需要一些基本负载的api平衡,因此问题.
解决方法
Google在其服务器上使用的大多数软件堆栈都是内部开发的.为了减轻不可避免的硬件故障的影响,软件被设计为容错的.
资料来源:Google Platform
在阅读完文章之后,我猜测它是通过使用Linux内部开发的内部软件堆栈来平衡几台服务器之间的负载相同的概念,这些服务器可扩展到1000台服务器.例如GFS(谷歌文件系统),BigTable – 基于GFS构建的结构化存储系统
他们使用负载平衡开关来分配负载.对网站的所有请求都到达一台机器,然后该机器将请求传递给其中一个可用服务器.交换机可以从服务器中找出哪个负载最少,因此所有这些都在进行相同的工作.
当客户端计算机尝试连接到Google时,多个DNS服务器会通过循环策略将www.google.com解析为多个IP地址.此外,这可以作为第一级负载平衡,并将客户端定向到不同的Google群集. Google群集有数千台服务器,一旦客户端连接到服务器,就会进行额外的负载平衡,以便将查询发送到负载最少的Web服务器.