MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB索引几乎和关系型数据库的索引一样.MongoDB的查询优化器能够使用这种数据结构来快速的对集合(collection)中的文档(collection)进行寻找和排序.准确来说,这些索引是通过B-Tree索引来实现的。在命令行中,可以通过调用ensureIndex()函数来建立索引,该函数指定一个到多个需要索引的字段,下面介绍mongodb索引如何优化
一、索引简介
例如如下数据
db.refactor.insert({"username":"refactor","age":24,"isactive":true}) db.refactor.insert({"username":"refactor","age":30,"isactive":false}) db.refactor.insert({"username":"aaaaa","age":34,"isactive":true}) db.refactor.insert({"username":"sssssss","isactive":true}) db.refactor.insert({"username":"tttttt","age":54,"isactive":true}) db.refactor.insert({"username":"bbbbb","isactive":false}) db.refactor.insert({"username":"rrrrr","isactive":true}) db.refactor.insert({"username":"rrrrr","isactive":false})
要按照username键进行查找,就可以在此键上建立索引,来提高查询速度.
db.refactor.ensureIndex({"username":1})
要按照username,age键进行查找,来提高查询速度.
db.refactor.ensureIndex({"age":1,"username":1})
传递给ensureIndex的文档是一组值为1或-1的键,1为升序,-1为降序,表示索引的创建方向.若索引只有一个键,则方向无关紧要.
若是有多个键,就得考虑索引的方向问题了.
二、mongodb自带的就有监控,根据这些监控信息,可以做为优化的依据
1、explain执行计划
MongoDB提供了一个explain命令让我们获知系统如何处理查询请求。利用explain命令,我们可以很好地观察系统如何使用索引来加快检索同时可以针对性优化索引。
几个关键的字段说明
cursor:返回游标类型(BasicCursor或BtreeCursor)
nscanned:被扫描的文档数量
n:返回的文档数量
millis:耗时(毫秒)
indexBounds:所使用的索引
例如
>db.order.ensureIndex({"user.uid":1}) >db.order.find({ "status": 1.0,"user.uid": { $gt: 2663199.0 } }).explain() { "cursor" : "BtreeCursor user.uid_1","nscanned" : 337800,"nscannedObjects" : 337800,"n" : 337800,"millis" : 1371,"nYields" : 0,"nChunkSkips" : 0,"isMultiKey" : false,"indexOnly" : false,"indexBounds" : { "user.uid" : [ [ 2663199,1.7976931348623157e+308 ] ] } }
2、优化器profile
在MysqL中慢查询日志是经常作为我们优化数据库的依据那在MongoDB中是否有类似的功能呢?答案是肯定的那就是MongoDBDatabaseProfiler。所以MongoDB不仅有而且还有一些比MysqL的SlowQueryLog更详细的信息。
mongodb把要输出的慢语句,存在于db.system.profile。与MysqL的slowlog配置相似,需要进行参数设置,mongo才会输出慢语句到profile。有两个参数来控制profile的输出
db.setProfilingLevel(level,slowms);
默认为0 不输出 1按第二个参数时间阀值(单位为毫秒)输出 2全部输出。通常我们在调优的时候都在测试环境打开参数。在生产环境下一般不输出profile。
比如
> db.system.profile.find({millis:{$gt:1000}})
profile输出的各项值的含义是
ts:命令执行时间
info:命令的内容
query:代表查询
order.order: 代表查询的库与集合
reslen:返回的结果集大小,byte数
nscanned:扫描记录数量
nquery:后面是查询条件
nreturned:返回记录数及用时
millis:所花时间
如果发现时间比较长,那么就需要作优化。
比如
(1)、nscanned数很大,或者接近记录总数,那么可能没有用到索引查询。
(2)、reslen很大,有可能返回没必要的字段。
(3)、nreturned很大,那么有可能查询的时候没有加限制。
三、MongoDB的索引选择机制
MongoDB的优化程序会在对比中选择更优秀的索引。
首先,它会给查询做一个初步的“最佳索引”;
其次,假如这个最佳索引不存在它会做尝试来选出表现最好的索引;
最后,优化器还会记住所有类似查询的选择(只到大规模文件变动或者索引上的变动)。
那么优化器是如何定义查询的“最佳索引”。最佳索引必须包含查询中所有可以做过滤及需要排序的字段。此外任何用于范围扫描的字段以及排序字段都必须排在做等值查询的字段之后。如果存在不同的最佳索引,那么Mongo将随机选择。
四、MongoDB的索引总结
1. 等值测试
索引中加入所有需要做等值测试的字段,任意顺序。
2. 排序字段(多排序字段的升/降序问题 )
3. 范围过滤
以字段的基数(Collection中字段的不同值的数量)从低到高的向索引中添加范围过滤字段。
4、如果索引中的等值或者范围查询字段不能过滤出Collection中90%以上的文档,那么把它移除索引估计会更好一些。
5、索引使得可以通过关键字段获取数据,能够使得快速查询和更新数据。但是,必须注意的是,索引也会在插入和删除的时候增加一些系统的负担。往集合中插入数据的时候,索引的字段必须加入到B-Tree中去,因此,索引适合建立在读远多于写的数据集上,对于写入频繁的集合,在某些情况下,索引反而有副作用。不过大多数集合都是读频繁的集合,所以集合在大多数情况下是有用的。
6、如果数据集合比较小(通常小于4M),使用sort()而不需要建立索引就能够返回数据。在这种情况下,做好联合使用limit()和sort()。
关于Mongodb索引的优化就给大家介绍这么多,希望对大家有所帮助!
您可能感兴趣的文章:
- MongoDB索引使用详解
- MongoDB的基础查询和索引操作方法总结
- MongoDB性能篇之创建索引,组合索引,唯一索引,删除索引和explain执行计划
- MongoDB中创建索引需要注意的事项
- pymongo给mongodb创建索引的简单实现方法
- MongoDB查询字段没有创建索引导致的连接超时异常解案例分享
- MongoDB学习笔记(六) MongoDB索引用法和效率分析
- mongodb处理中文索引与查找字符串详解
- pymongo为mongodb数据库添加索引的方法
- MongoDB数据库中索引(index)详解
- MongoDB入门教程之索引操作浅析
- MongoDB教程之索引介绍
- MongoDB的索引
- MongoDB数据库中索引和explain的使用教程
- mongodb索引知识_动力节点Java学院整理
- MongoDB TTL索引的实例详解
- 基于MongoDB数据库索引构建情况全面分析
- @L_301_17@