如何提高MongoDB插入性能

Jam*_*mes 22 c# performance mongodb mongodb-.net-driver

结果:

如果您正在对容错的数据集进行操作,或者执行一次性过程,则可以进行验证,将WriteAcknowledge更改为Unacknowledged可以提供帮助.

此外,默认情况下批量操作是IsOrdered,我不知道.将此设置为False实际上会使操作批量执行,否则它将作为一个更新线程运行.


MongoDB 3.0/WiredTiger/C#驱动程序

我有一个147,000,000个文档的集合,其中我每秒钟(希望)大约会执行更新.3000个文件.

以下是更新示例:

"query" : {
    "_id" : BinData(0,"UKnZwG54kOpT4q9CVWbf4zvdU223lrE5w/uIzXZcObQiAAAA")
},
"updateobj" : {
    "$set" : {
        "b" : BinData(0,"D8u1Sk/fDES4IkipZzme7j2qJ4oWjlT3hvLiAilcIhU="),
        "s" : true
    }
}
Run Code Online (Sandbox Code Playgroud)

这是一个典型的更新,我的要求是以每秒3000的速度插入.

不幸的是,这些花费的时间是原来的两倍,例如最后一次更新是针对1723个文档,并且需要1061ms.

该集合仅在_id上有索引,没有其他索引,并且该集合的平均文档大小为244字节,无上限.

服务器有64GB内存,12个线程.插入性能非常好,收集尺寸较小,比如大约5000万,但是大约有8000万之后真正开始下降.

可能是因为整套不在内存中吗?数据库由RAID0 SSD支持,因此IO性能不应成为瓶颈,如果它应该在一开始就显示出来?

我会相信一些指导,因为我相信MongoDB可以满足我的相当微薄的要求,而不是它所使用的一些应用程序.数据库没有大量的读取率,因此Sharding不会改善问题,尽管可能我错了.

无论哪种方式,当前的插入率都不够好.

更新:这是查询的解释()...

"queryPlanner" : {
    "plannerVersion" : 1,
    "namespace" : "Collection",
    "indexFilterSet" : false,
    "parsedQuery" : {
        "_id" : {
            "$eq" : { "$binary" : "SxHHwTMEaOmSc9dD4ng/7ILty0Zu0qX38V81osVqWkAAAAAA", "$type" : "00" }
        }
    },
    "winningPlan" : {
        "stage" : "IDHACK"
    },
    "rejectedPlans" : []
},
"executionStats" : {
    "executionSuccess" : true,
    "nReturned" : 1,
    "executionTimeMillis" : 1,
    "totalKeysExamined" : 1,
    "totalDocsExamined" : 1,
    "executionStages" : {
        "stage" : "IDHACK",
        "nReturned" : 1,
        "executionTimeMillisEstimate" : 0,
        "works" : 2,
        "advanced" : 1,
        "needTime" : 0,
        "needFetch" : 0,
        "saveState" : 0,
        "restoreState" : 0,
        "isEOF" : 1,
        "invalidates" : 0,
        "keysExamined" : 1,
        "docsExamined" : 1
    },
    "allPlansExecution" : []
},
Run Code Online (Sandbox Code Playgroud)

它本身的查询非常快,并且更新操作大约需要25毫秒,它们通过使用BulkWriter被推送到Mongo: await m_Collection.BulkWriteAsync(updates);

D.R*_*ado 14

您可以尝试修改写入关注级别.显然存在风险,因为您无法捕获任何写入错误,但至少您应该仍然能够捕获网络错误.由于MongoDB将批量插入操作分组为1000个,因此应该加快该过程.

W默认为1:

在此输入图像描述

将其更改为0时:

在此输入图像描述

如果您不关心元素的顺序,可以获得一些调用无序批量操作的速度

await m_Collection.BulkWriteAsync(updates, new BulkWriteOptions() { IsOrdered = false });
Run Code Online (Sandbox Code Playgroud)

使用无序操作列表,MongoDB可以并行执行列表中的写操作以及任何顺序.链接

  • 我的测试没有得出正确的结果。在 WriteConcern Unacknowledged 和 IsOrdered 设置为 false 的情况下从头开始重新运行导入能够保持大约 10% 的时间。每秒 35k 的插入速率以及大约。每秒 11k 更新速率。非常棒的结果,谢谢。 (2认同)