随着
Hadoop和
CouchDB遍布博客和相关新闻,什么是实际工作的分布式容错存储(引擎).
> CouchDB实际上并没有内置的任何分发功能,据我所知,自动分发条目甚至整个数据库的粘合剂都是缺失的.
> Hadoop似乎被广泛使用 – 至少它获得了良好的压力,但仍有一个单点故障:NameNode.另外,它只能通过FUSE安装,我知道HDFS实际上并不是Hadoop的主要目标
> GlusterFS确实没有共享概念,但最近我读了几篇帖子,这些帖子让我觉得它不太稳定
> Lustre因使用专用元数据服务器而出现单点故障
> Ceph似乎是首选玩家,但主页声称它仍处于alpha阶段.
所以问题是哪个分布式文件系统具有以下功能集(没有特定的顺序):
> POSIX兼容
>轻松添加/删除节点
>无共享概念
>在廉价硬件(AMD Geode或VIA Eden类处理器)上运行
>内置身份验证/授权
>一个网络文件系统(我希望能够在不同的主机上同时安装它)
很高兴有:
>本地可访问的文件:我可以使用标准的本地文件系统(ext3 / xfs / whatever …)来安装一个节点并仍然访问文件
我不是在寻找托管应用程序,而是让我能够拿出10GB的硬件盒,并在我们的网络中提供该存储,可以轻松安装在众多主机上.
解决方法
我认为你将不得不放弃POSIX要求,很少有系统实现这一点 – 实际上甚至NFS并不真正(想想锁等)并且没有冗余.
任何使用同步复制的系统都会变得非常缓慢;任何具有异步复制(或“最终一致性”)的系统都将违反POSIX规则,而不像“常规”文件系统.