频道导航

Cassandra源码学习：数据读取

2020-05-30 NoSQL 前端之家

前端之家收集整理的这篇文章主要介绍了Cassandra源码学习：数据读取，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

读取流程

cassandra的数据可能在Memtable中，也可能在多个SSTable中，每个地方都可能有某个column对应的值，怎么才能读取最新的值呢？有必要了解下cassandra读取数据流程：

（1）判断rowcache中是否有需要读取的数据，如果有直接返回；

（2）从Memtable中获取数据，调用getColumnFamily方法获取该列族的数据；

（3）从多个SSTable中获取相关列的数据：

a、先通过bloom filter文件判断该key是否存在于SSTable中，如果存在，进行第二步；

b、查询key_cache中是否有当前key，如果有直接定位到key所在SSTable中的位置；

c、 key_cache可不存在，通过index定位到具体位置。

下图是从SSTable中获取数据的过程

（4）将（2）（3）中的数据进行合并后返回给客户端。

下图是cassandra读取数据示意：

RowCache

RowCache中缓存了最近读取的列信息，常常将一些热点数据放入RowCache中，减少了操作磁盘的开销。Cassandra写入数据后会同步更新RowCache，保证RowCache中的数据是最新的。

KeyCache

与RowCache不同，KeyCache中缓存了最近查询的row key在SSTable中的位置，每次查询到row key所在位置后会写入KeyCache中。如果KeyCache中含有对应key，就不用再通过访问index文件了，减少了一次磁盘访问。

二级索引

如果查询的key并不是一个row key怎么办，比如User列族以userId做为row key，每个row key中包含姓名、性别、身份证等，需要按身份证查询用户怎么办？

需要在身份证这个列上建一个二级索引，二级索引也相当于是一个列族，row key为身份证号码,只有一个column名为userId。

先通过二级索引找到key对应的row key，再用row key定位到具体数据。

压缩机制

cassandra后台会有一个线程，将多个SSTable进行合并，保证同一个列族在一个SSTable文件中，同时会删除被标记为墓碑的值（超过gc_grace_seconds）。

压缩可以防止文件碎片，有效提升读取效率，减少磁盘I/O。

压缩是在后台进行的，对客户端透明，频繁地进行数据压缩会导致系统不稳定，因为压缩本身也会有大量的磁盘I/O,可以在配置文件中配置压缩的优先级，还可以考虑关闭自动压缩，在系统空闲时手动压缩。

上一篇：NoSql学习之路一redis做消息队列下一篇：Cassandra源码学习：机架感应策略

猜你在找的NoSQL相关文章

Redis进阶实践之十八使用管道模式提高Redis查询的速度

一、引言学习redis 也有一段时间了，该接触的也差不多了。后来有一天，以前的同事问我，如...

作者：前端之家时间：2020-11-07

MongoDb进阶实践之二如何在Windows上安装和配置MongoDB

一、引言上一篇文章，我介绍了如何在Linux系统上安装和配置MongoDB，其实都不是很难，不需...

作者：前端之家时间：2020-11-07

Redis进阶实践之十七 Redis协议的规范

一、介绍 Redis客户端使用RESP（Redis的序列化协议）协议与Redis的服务器端进行通信。虽然...

作者：前端之家时间：2020-11-07

Redis进阶实践之十九 Redis如何使用lua脚本

一、引言 redis学了一段时间了，基本的东西都没问题了。从今天开始讲写一些redis和lua脚本...

作者：前端之家时间：2020-11-07

Redis进阶实践之十五 Redis-cli命令行工具使用详解第二部分（结束）

一、介绍今天继续redis-cli使用的介绍，上一篇文章写了一部分，写到第9个小节，今天就来完...

作者：前端之家时间：2020-11-07

Redis进阶实践之十四 Redis-cli命令行工具使用详解第一部分

一、介绍 redis学了有一段时间了，以前都是看视频，看教程，很少看官方的东西。现在redis的...

作者：前端之家时间：2020-11-07

MongoDb进阶实践之七 MongoDB的索引入门

一、引言好久没有写东西了，MongoDB系列的文章也丢下好长时间了。今天终于有时间了，就写...

作者：前端之家时间：2020-11-07

Memcached在Linux环境下的使用详解

一、引言写有关NoSQL数据库有关的文章已经有一段时间了，可以高兴的说，Redis暂时就算写完...

作者：前端之家时间：2020-11-07

Redis进阶实践之二十 Redis的配置文件使用详解

一、引言写完上一篇有关redis使用lua脚本的文章，就有意结束Redis这个系列的文章了，当然...

作者：前端之家时间：2020-11-07

Redis进阶实践之十二 Redis的Cluster集群动态扩容

一、引言上一篇文章我们一步一步的教大家搭建了Redis的Cluster集群环境，形成了3个主节点...

作者：前端之家时间：2020-11-07

编程分类

MySQL MsSQL Oracle Sqlite Postgre SQL Mariadb MongoDB NoSQL HBase JDBC

最新文章