数据库设计 – 大型搜索引擎使用哪些数据库技术?

前端之家收集整理的这篇文章主要介绍了数据库设计 – 大型搜索引擎使用哪些数据库技术?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
有人知道谷歌或雅虎如何针对非常大量的数据搜索关键词吗?他们为此采用了哪种数据库或技术?

它需要几毫秒,但它们有超过十亿页索引.

解决方法

我确信有一些组合:

>严重的硬件
>大量的 – 数据在许多节点和不同的数据中心之间分布和复制

>(实际上在谷歌的情况下,至少我相信他们有成千上万的真正的低端服务器)

>缓存了许多常见查询的结果,注意他们如何预先填充您以前从未搜索过的内容的潜在搜索;他们预测你可能会搜索什么,并希望他们已经预先计算出你的结果并在某处缓存.在他们的很多情况下 – 你今天在Google上提出的搜索次数并不多,而你之前没有人问过.当他们确实得到一个新的搜索短语时,他们可能会使用像自由文本搜索这样的东西 – 我希望在首次抓取页面时在语义上提取关键字,而不是在搜索完文档后尝试在文档中查找关键字.当然,他们必须定期使这些缓存无效,重新计算页面排名,并在缓存中分发新的缓存结果 – 我相信这背后有很多严肃的工程.

猜你在找的MsSQL相关文章