我想构建一个类似于谷歌分析的网络应用程序,我在其中收集客户最终用户的统计数据,并根据该数据向客户展示分析.
特点:
>高扩展性,处理量非常大
>分区 – 查询始终在单个客户的数据上运行
>支持分析查询(向下钻取,切片等)
由于分析需要,我正在考虑使用OLAP / BI套件,但我不确定它是否适合这种规模. Nosql数据库?简单的RDBMS会做什么?
解决方法
这些是我在生产环境中使用的,它就像一个魅力.
我搞了三件事
Postgresql LucidDB Mondrian(更一般地说是整个Pentaho BI套件组件)
> PostgreSQL:我不打算描述postgresql,真正强大的开源RDBMS会让你 – 当然 – 你需要的一切.我用它来存储我的运营数据.
> LucidDB:LucidDB是一个开源的列存储数据库.与Postgresql相比,它具有高度可扩展性,可以提供更长的处理时间,用于检索大量数据.它不是针对事务处理而是针对密集读取进行优化的.这是我的Datawarehouse数据库
> Mondrian:Mondrian是一个开源的R-OLAP多维数据集. LucidDB可以轻松地将这两个程序连接在一起.
我建议你看看整个Pentaho BI套件,值得一试,你可能想要使用一些组件.
希望我能帮忙,