关于mongodb创建索引的一些经验总结（转）

查看语句执行计划：　　explain() 在mongodb3+版本后输出格式发生改变：

详情参见：https://docs.mongodb.com/v3.0/reference/method/cursor.explain/

查看执行耗时：db.collection名称.find().explain('executionStats')

一，索引介绍

mongodb具有两类索引，分别为单键索引和复合索引。

1.单键索引是最简单的一种索引，创建单键索引的开销要比复合索引小很多。单键索引主要用于针对单值查询的条件。

2.复合索引是将文档中的几个键联合起来创建的一种索引，创建这种索引需要更多的空间与性能开销。分别体现在：

1).在给大量数据创建复合索引时，会阻塞数据库的查询，更不用说修改和插入操作了；

2).插入一条数据时，要花费更多的时间来给复合索引加数据；

3).创建的复合索引所站得空间大小根据数据的类型以及键的数量而有所不同。比如，如果你用五个NumberInt的键创建的复合索引的空间大小，并不会比两个NumberInt和一个String类型创建的复合索引占用更多的空间。索引在设计数据类型时，尽量将数据类型设置为NumberInt类型，以及尽量少使用string类型的数据做索引；

二，创建索引

创建索引的语句很简单。

1.单键索引的创建：db.test.ensureIndex({name:1},{name:'index_name'})

2.复合索引的创建：db.test.ensureIndex({name:1,age:1,sex:1},{name:'index_nas'})

//查询当前文档的索引
db.CollectionName.getIndexes()

//查询当前库的所有索引

db.system.indexes.find()

三，索引优化

索引的优化是一个重头戏，需要详细的来解释。我得测试数据插入了100万条。字段分别为name,sex,type,time,id

1.我们来看一个简单的查询：db.test.find({name:'name_1'}) 相信大家对这个查询已经很熟悉了，然后我们来看看这个语句的索引执行计划：

{

    "cursor" : "BasicCursor",   查询语句所用到的索引，而BasicCursor代表没有索引

    "isMultiKey" : false,     是否为复合索引

    "n" : ,       查询到的结果数

    "nscannedObjects" : ,    扫描的文档数量

    "nscanned" : ,     扫面的索引数量

    "nscannedObjectsAllPlans" : ,   //影响的所有的被扫描文档的总数量

    "nscannedAllPlans" : ,      //所有被扫描的索引的总数量

    "scanAndOrder" : false,  是否排序

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,   花费的时间

    "indexBounds" : {

    },

    "server" : "node1:27017"

}

从这个执行计划中可以看出，该条查询语句查询一条数据需要扫描整个表，这肯定扯淡了嘛，那这时候就该给这个字段创建索引了，创建一个单键索引

db.test.ensureIndex({name:1},{name:'index_name'})

创建完索引之后，再来查看看这条查询语句的执行计划：

{

    "cursor" : "BtreeCursor index_name",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "name" : [

            [

                "name_1",

                "name_1"

            ]

        ]

    },

    "server" : "node1:27017"

}

简直是逆天啊，nscanned和nscannedObjects居然从100万下降到1条，也就是查询数据时，只扫描了一条就已经找到，而且花费的时间是0秒，没有创建索引时，居然是342毫秒，绝对索引威武啊。

2.这时候我想通过type和sex来组合查询某一条件的数据: db.test.find({type:1,sex:0}) 看看这句的执行计划：

{

    "cursor" : "BasicCursor",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

    },

    "server" : "node1:27017"

}

从这个计划中可以看出，为了查找几万条数据，它也扫描了整个表，很显然，该创建索引了：

db.test.ensureIndex({type:1,sex:1},{name:'index_ts'})

创建完索引之后，再来执行查询语句，看看执行计划：

db.test.find({type:,sex:}).explain()

{

    "cursor" : "BtreeCursor index_ts",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ]

    },

    "server" : "node1:27017"

}

很显然，绝对是一个最佳索引，因为n=nscannedObjects=nscanned了，而且查询时间从529毫秒下降到112毫秒了，这也是一个质的飞跃，可以明显的看到，它使用了刚刚创建的index_ts索引。

现在我又有一个需求了，我想通过时间再来排序，好的，我们执行查询语句： db.test.find({type:1,sex:0}).sort({time:-1}) 我们来看看这个查询语句的执行计划：

{

    "cursor" : "BtreeCursor index_ts",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : true,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ]

    },

    "server" : "node1:27017"

}

看到没，这个查询语句跟上一个创建索引之后的查询出来的结果相差还是很大的，scanAndOrder和millis,时间花费了将近700毫秒，而且在查询完毕之后还要排序，这也太不近人情了，就加了一个排序操作，怎么会让它从白天鹅变成丑小鸭了呢？啊，关键参数就是scanAndOrder，意思就是在内存中把结果排序了嘛，那好啊，既然你如此薄情，那我就建个复合索引来对抗: db.test.ensureIndex({type:1,sex:1,time:-1},{name:'index_tst'})

{

    "cursor" : "BtreeCursor index_tst",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ],

        "time" : [

            [

                {

                    "$maxElement" :

                },

                {

                    "$minElement" :

                }

            ]

        ]

    },

    "server" : "node1:27017"

}

看到了吗？各种参数又回到最佳状态了。这时候可能有人会问了，为什么要把time放到索引的最后而不是其它位置呢？其实这在创建索引时是有要求的，即：

将等值索引放在最前面
尽量将排序字段放在范围字段的前面
$nin和$ne跟索引没有关系

接下来我们再给查询语句加条件： db.test.find({type:1,sex:0,id:{$gt:1,$lt:500000}}) 执行计划如下:

{

    "cursor" : "BasicCursor",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

    },

    "server" : "node1:27017"

}

可以看到，只返回两万多条数据，但是却扫描了整个表，这肯定是很蛋疼的事情嘛，索引走起：

db.test.ensureIndex({type:1,sex:1,id:1},{name:'index_tis'})

{

    "cursor" : "BtreeCursor index_tis",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ],

        "id" : [

            [

                ,

            ]

        ]

    },

    "server" : "node1:27017"

}

很显然，这是个非常不错的组合索引，那为何不把id放在其它地方，偏偏放在最后面呢？因为在mongodb中，索引是从左到右执行的，因此显然要从左到右一次过滤最大数量的数据显然type和sex的组合过滤数据量要比id高更多，因为id的忙查率要远高于这两个组合。

接着再把按time排序加上，查询：db.test.find({type:1,sex:1,id:{$gt:0,$lt:1000000}}).sort({time:-1}).explain()

{

    "cursor" : "BasicCursor",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : true,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

    },

    "server" : "node1:27017"

}

可以看到，这个查询语句也是极其慢的，而且还要再内存中排序，所以肯定要创建索引了：

db.test.ensureIndex({type:1,sex:1,id:1,time:-1},{name:'index_tist'}) 我们先这样创建索引，看看执行计划：

{

    "cursor" : "BtreeCursor index_tist",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : true,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ],

        "id" : [

            [

                ,

            ]

        ],

        "time" : [

            [

                {

                    "$maxElement" :

                },

                {

                    "$minElement" :

                }

            ]

        ]

    },

    "server" : "node1:27017"

}

看到了没有，虽然查询时间缩短了，但是这个查询结果还是会排序结果，好，我们再把索引改改：

db.test.ensureIndex({type:1,sex:1,time:-1,id:1},{name:'index_tist'})

{

    "cursor" : "BtreeCursor index_tist",

    "isMultiKey" : false,

    "n" : ,

    "nscannedObjects" : ,

    "nscanned" : ,

    "nscannedObjectsAllPlans" : ,

    "nscannedAllPlans" : ,

    "scanAndOrder" : false,

    "indexOnly" : false,

    "nYields" : ,

    "nChunkSkips" : ,

    "millis" : ,

    "indexBounds" : {

        "type" : [

            [

                ,

            ]

        ],

        "sex" : [

            [

                ,

            ]

        ],

        "time" : [

            [

                {

                    "$maxElement" :

                },

                {

                    "$minElement" :

                }

            ]

        ],

        "id" : [

            [

                ,

            ]

        ]

    },

    "server" : "node1:27017"

}

再来看看，快到什么程度了，这个查询的速度和参数条件已经比上一个索引的快了很多，那为什么会出现这种情况呢？为什么time在id的前后会有不同的表现？这是因为通过type和sex字段过滤完之后，已经在内存中有了数据，而这些数据下一步需要怎么办？是先通过id来筛选，还是按照排序筛选呢？这里有一个知识点，在把id放在time前面时，程序首先会取复合id值，然后再把复合的数据排序，但是如果id放在排序的后面，那么程序将直接通过顺序扫描索引树的方式取出复合id范围的数据。

四，总结

1.mongodb创建索引难点在于排序和范围查询的字段位置选择

2.mongodb的复合索引的索引截取查询是顺序的，即如果(a:1,b:1,c:1},则可以是查询{a:1},{a:1,b:1},{a:1,b:1,c:1}中得任何一种都会使用该索引，其它查询情况将不会用到该索引；

3.尽量创建更少的索引以提高数据库性能

4.以上的索引优化只是生产环境的一部分，具体情况可能还要看自己的业务来定

关于mongodb创建索引的一些经验总结（转）的更多相关文章

上mongodb创建一些吸取的经验教训指数
想来接触mongodb它已经快一年了,对于其指数已经积累了很多的经验,知识,以这个夜黑风高的优势,放mongodb总结一番吧. 一,索引介绍 mongodb具有两类索引,分别为单键索引和复合索引. 1 ...
linux环境给mongodb创建索引
首先我们来了解索引,如果有基础的可以直接看最后面的操作. 可参照 DoNotStop 的CSDN 博客 ,全文地址请点击: https://blog.csdn.net/u013725455/artic ...
MongoDB 创建索引的语法
1.为普通字段添加索引,并且为索引命名 db.集合名.createIndex( {"字段名": 1 },{"name":'idx_字段名'}) 说明: (1)索 ...
Mongodb 创建索引
db.getCollection('ct_project').ensureIndex({'pro_code':1}) 创建索引 db.getCollection('ct_project').ensu ...
MongoDB 创建索引及其他
索引以提升查询速度测试:插入十万条数据到数据库中 for(i=0;i<100000;i++){db.t255.insert({name:'test'+i,age:i})} db.t1.fin ...
MongoDB创建索引（不锁库方法）
db.collection.createIndex( { a: 1 }, { background: true } )https://docs.mongodb.org/manual/tutorial/ ...
MongoDB性能篇之创建索引，组合索引，唯一索引，删除索引和explain执行计划
这篇文章主要介绍了MongoDB性能篇之创建索引,组合索引,唯一索引,删除索引和explain执行计划的相关资料,需要的朋友可以参考下一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存 ...
mongodb 创建LBS位置索引
<dependency> <groupId>org.mongodb</groupId> <artifactId>mongo-java-driver< ...
MongoDB 创建基础索引、组合索引、唯一索引以及优化
一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样.其实可以这样说说,索引 ...

随机推荐

Java并发编程，深度探索J.U.C - AQS
java.util.concurrent(J.U.C)大大提高了并发性能,AQS 被认为是 J.U.C 的核心. CountdownLatch 用来控制一个线程等待多个线程. 维护了一个计数器 cnt ...
python在程序中通过Windows打开文件
import os os.startfile(r'D:\test_input.html')
Install Ruby on Rails on Ubuntu 12.04 LTS
1:Update package repository. sudo apt-get update 2:Install git and Curl. Git:是一个简单,快速,高效的版本控制系统. ...
tomcat部署不成功 Deployment failure on Tomcat 6.x. Could not copy all resources to
解决办法: tomcat服务并没有启动.上网搜索之后发现和大家犯的是一个毛病,原来工程中我引了一个包,后来这个包被我给删除了,但是因为已经发布过这个工程了,所以classpath中就有这个包名了,这样 ...
FTP经典常用命令
FTP命令是Internet用户使用最频繁的命令之一,不论是在DOS还是UNIX操作系统下使用FTP,都会遇到大量的FTP内部命令. 熟悉并灵活应用FTP的内部命令,可以大大方便使用者,并收到事半功倍 ...
C#面试基础题1
1.简述 private. protected. public. internal 修饰符的访问权限.(C++中没有internal) private : 私有成员, 在类的内部才可以访问 ,也就是类 ...
sublime text常用快捷键(转)
选择一个选中项的下一个匹配项: ctrl+d 把光标放在一个单词上,按下ctrl+ D,将选择这个单词.一直按住ctrl且按D多次,将选择当前选中项的下一个匹配项.通过按住ctrl,再按D三次,将选择 ...
C#网络编程：Socket编程
套接字简介:套接字最早是Unix的,window是借鉴过来的.TCP/IP协议族提供三种套接字:流式.数据报式.原始套接字.其中原始套接字允许对底层协议直接访问,一般用于检验新协议或者新设备问题,很少 ...
有用PHP依赖管理工具Composer新手教程
PHP依赖管理工具Composer新手教程 Composer 是 PHP 的一个依赖管理工具.它同意你申明项目所依赖的代码库,它会在你的项目中为你安装他们. 依赖管理 Composer 不是一个包管理 ...
[集合]解决system权限3389无法添加的用户情况
Webshell有了SYSTEM权限,却无法成功添加administrators用户,因此导致无法成功连接3389.总结原因有以下几点:I.杀软篇1,360杀毒软件2,麦咖啡杀毒软件3,卡巴斯基杀毒软 ...

关于mongodb创建索引的一些经验总结（转）

关于mongodb创建索引的一些经验总结（转）的更多相关文章

随机推荐

热门专题