现在有一种情况,我们实际上需要编写数据,然后用更多的数据完成它,一段时间后就完成了.它可以由任何一个制成;
>使用INSERT(所有数据都可用)再次覆盖连续的所有数据,或>仅对新数据执行更新.
什么是最好的方法,牢记速度而不是创建墓碑是重要的?
Cassandra与您描述的用例非常吻合.增量添加数据将适用于INSERT和UPDATE语句.如果为同一分区键添加数据,Cassandra会将数据存储在不同的位置.定期运行压缩将再次合并数据以获得单个密钥,以优化访问和可用磁盘空间.这将基于写入值的时间戳发生,但不会创建任何新的逻辑删除.您可以详细了解Cassandra如何存储数据,例如here.