MongoDB 使用索引排序查询结果
翻译自 官方文档 。
在 MongoDB 中, sort 操作可以基于一个索引上字段排列检索文档来获得排序顺序。如果查询计划(query planner)不能从某一个索引上获取排序顺序,它将在内存中把查询结果排序。使用索引的 sort 操作通常比那些不用索引的有更好的性能。另外, 不能利用索引的 sort 操作,当它用了 32M 的内存空间时将自动终止 。
排序和单字段索引
如果一个单字段索引上有一个升序或降序的索引,在这个字段上的 sort 操作可以是任何方向的。例如,在
records
集合的
a
字段上创建一个升序的索引:
db.records.createIndex({a: 1})
这个索引可以支持在 a
字段上升序的遍历,也可以支持以相反的顺序遍历:
db.records.find().sort( { a: 1 } )
db.records.find().sort( { a: -1 } )
排序和多字段索引
排序和索引前缀
索引前缀 是一个复合索引(compound index)的一个子集,它是由索引的起始字段开始的一个或多个 key 组成。
比如,在 data 表上创建了一个复合索引:
db.data.createIndex( { a:1, b: 1, c: 1, d: 1 } )
那么,下面的这些就是这个索引的前缀:
{ a: 1 }
{ a: 1, b: 1 }
{ a: 1, b: 1, c: 1 }
下面的搜索和排序操作就使用了索引前缀去排序查询结果。这些操作不需要在内存中对搜索结果进行排序:
考虑一下上图最后一个例子,索引的字段同时出现在查询谓语(query predicate)和排序上。在这种情况下,MongoDB 可以按 sort 以指定顺序使用索引检索文档。正如例子所示,查询谓语中的索引前缀可以不同于排序的前缀。
排序和索引的非前缀子集
一个索引可以在索引字段规则的非前缀子集上支持排序操作,为了这样做,查询条件必须在索引字段中的排序字段之前所有的前缀字段上包含等价条件。
例如,data
集合上有如下索引:
{a: 1, b: 1, c: 1, d: 1}
下面的操作可以使用索引获取到排序顺序:
正如上面最后一条操作所示,在 sort 字段子集前的索引字段必须在检索文档上有等价条件;其他的索引字段可以指定其他的条件。
如果在搜索条件上没有指定位于 sort 字段前或覆盖 sort 字段的索引前缀字段上的等价条件,那么这个操作将 不能有效地 利用这个索引。
例如,下面的操作指定了按 {c: 1}
排序文档,但搜索条件不包含位于索引字段前面字段 a
和 b
的等价匹配。这些操作将不能有效地利用索引 { a: 1, b: 1, c: 1, d: 1 }
并且甚至不能使用到索引。
db.data.find( { a: { $gt: 2 } } ).sort( { c: 1 } )
db.data.find( { c: 5 } ).sort( { c: 1 } )
用自己的话总结一下,上面所述重点讲了三条规则:
单字段的索引,创建时不论指定升序还是降序,它查询时用的 sort 可以是任意方向的(升序或降序)。
多字段的索引按前缀匹配
sort 条件是 index 的前缀子集时,query 条件可以为空,也可以为任何 index 的前缀子集。
sort 条件不是 index 的前缀子集时,query 条件必须包含 index 字段中 sort 字段前方的所有字段。