Vai*_*hek 4 query-optimization mongodb pymongo
我在MongoDB中有一个集合,其中包含以下文档。
/* 0 */
{
"T" : [
374135056604448742
],
"_id" : {
"#" : 7778532275691,
"ts" : ISODate("2013-07-26T02:25:00Z")
}
}
/* 1 */
{
"T" : [
1056188940167152853
],
"_id" : {
"#" : 34103385525388,
"ts" : ISODate("2013-07-30T03:00:00Z")
}
}
/* 2 */
{
"T" : [
1056188940167152853
],
"_id" : {
"#" : 34103385525388,
"ts" : ISODate("2013-07-30T03:18:00Z")
}
}
Run Code Online (Sandbox Code Playgroud)
现在,我正在尝试使用以下查询来查询一些文档。
db.entries.find({
'_id.ts': {'$gte': beginTS, '$lte': endTS},
'_id.#' : 884327843395156951
}).hint([('_id', 1)]).explain()
Run Code Online (Sandbox Code Playgroud)
根据我的理解,由于_id是复合字段,而Mongo始终在_id上保留索引,因此为了回答以上查询,Mongo应该在'_id'上使用索引。但是,上述查询的答案如下:
{u'allPlans': [{u'cursor': u'BtreeCursor _id_',
u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
u'n': 2803,
u'nscanned': 4869528,
u'nscannedObjects': 4869528}],
u'cursor': u'BtreeCursor _id_',
u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
u'indexOnly': False,
u'isMultiKey': False,
u'millis': 128415,
u'n': 2803,
u'nChunkSkips': 0,
u'nYields': 132,
u'nscanned': 4869528,
u'nscannedAllPlans': 4869528,
u'nscannedObjects': 4869528,
u'nscannedObjectsAllPlans': 4869528,
u'scanAndOrder': False,
Run Code Online (Sandbox Code Playgroud)
可以看出,MongoDB正在对数据库进行整个扫描,以查找少量文档。我不知道这到底是怎么了。
我尝试更改查询顺序,但结果相同。我不知道这里发生了什么。任何帮助,如果深表感谢。
更新
我了解这里的细微差别。_id不是复合索引,它只是精确的索引。这意味着,如果_id是一个文档,则不管文档的结构以及它可能具有多少个嵌套的attrs或子文档,_id索引将只包含一个用于_id字段的条目。假定该条目是_id文档的哈希,并且将保持唯一。
您将对象用作键,但此处未使用compund索引。
该_id指数是一个比较特殊的,因为它会自动创建并始终是唯一的。通常,_id索引是包含某种哈希的an ObjectId,a UUID或也许an integer或字符串。MongoDB支持将复杂对象用作键。但是,对于MongoDB来说,这仍然只是一个文档。可以将其与其他文档进行比较,并且具有相同字段和值的文档将相等。但是由于您没有创建索引键(并且您无法手动创建该索引),所以MongoDB不知道它包含一个field #和一个field ts。
另一方面,复合索引明确地指代文档的字段,例如{"product.quantity" : 1, "product.created" : -1}。创建索引时必须指定此选项。
看来您正在尝试将时间戳存储在主键中。MongoDB ObjectId已经包含一个时间戳,因此您可以ObjectIds直接进行基于日期的范围查询。
| 归档时间: |
|
| 查看次数: |
3661 次 |
| 最近记录: |