我有一个应用程序,需要分析不同级别的聚合,这就是OLAP工作负载.我想更频繁地更新我的数据库.
例如,这里是我的更新的样子(模式看起来像:time,dest,source ip,browser – >访问)
(15:00-1-2-2010,www.stackoverflow.com,128.19.1.1,safari) --> 105 (15:00-1-2-2010,128.19.2.1,firefox) --> 110 ... (15:00-1-5-2010,www.cnn.com,128.19.5.1,firefox) --> 110
然后我想问一下上个月从firefox浏览器访问www.stackoverflow.com的内容.
我知道Vertica系统可以以相对便宜的方式(性能和可扩展性明智,但不是成本方面)来做到这一点.我在这里有两个问题
1)有没有一个开源产品可以建立在这个问题上呢?特别是,蒙德里安系统的工作效果如何? (可扩展性和性能)
2)有没有HBase或Hypertable基础解决方案(显然,赤裸裸的HBase / Hypertable不能这样做)? – 但是如果有一个基于HBase / Hypertable的项目,可扩展性可能不会是一个问题IMO)?
谢谢!