标签: lsm-tree

术语 SSTable 和 LSM Tree 之间有什么区别

这两个术语可以互换使用吗？

我已经阅读了关于 SSTable 是如何工作的，通常，文章只是开始提到 LSM 树。然而，它们似乎是同一回事。

我什么时候应该使用一个术语而不是另一个？

database indexing lsm-tree

Kak*_*you

lucky-day

15
推荐指数

3
解决办法

2782
查看次数

如何维护LSM树中的稀疏索引？

在设计数据密集型应用程序中，Martin 介绍了一种称为 LSM 树的数据结构。

主要由 3 部分组成：内存中的 memtable（通常是红黑树）、内存中的稀疏索引和磁盘上的 SSTable（又名段）。他们像这样一起工作：

当发生写入时，它首先进入内存表，当内存表变满时，所有数据都会刷新到新段中（所有键都已排序）。
当发生读取时，它首先查找内存表。如果该键不存在，它会查找稀疏索引，以了解该键可能驻留在哪个段。参见图 1。
定期进行压缩，将多个段合并为一个。参见图 2。

从图 2 中可以看出，键在段内排序，但键在段之间不排序。这让我想知道：我们如何维护索引中的稀疏索引 st 键具有递增的偏移量？

database nosql lsm-tree

Yik*_*han

lucky-day

4
推荐指数

1
解决办法

885
查看次数

范围查询如何在 LSM（日志结构合并树）上工作？

最近我一直在研究数据库中常见的索引结构，比如 B+-trees 和 LSM。我对点读/写/删除/压缩如何在 LSM 中工作有一个可靠的处理。

例如（在 RocksDB/levelDB 中），在点查询读取时，我们将首先检查内存索引（memtable），然后是从最近到最近的一些 SST 文件。在 LSM 的每个级别上，我们将使用二分搜索来帮助加快查找给定密钥的每个 SST 文件的速度。对于给定的 SST 文件，我们可以使用布隆过滤器快速检查密钥是否存在，从而节省更多时间。

我没有看到范围读取具体是如何工作的。LSM 是否必须在每个 SST 级别（包括 memtable）上打开一个迭代器，并在所有级别上同步迭代，以返回最终的排序结果？它是否仅作为一系列点查询实现（几乎绝对不是）。是否先拉出所有潜在的键，然后再排序？希望有人在这里有任何见解。

我无法找到有关该主题的太多文档，任何见解在这里都会有所帮助。

indexing key-value-store range-query lsm-tree

shi*_*jin

lucky-day

2
推荐指数

1
解决办法

1244
查看次数

MongoDB：如何更改 _id_ 索引的引擎类型（从 B-Tree 到 LSM-Tree）？

我们可以使用WiredTiger引擎创建一个集合type=lsm，但是MongoDB文档中没有提到这个功能：

db.createCollection( "test", { storageEngine: { wiredTiger: {configString: "type=lsm"}}} )
Run Code Online (Sandbox Code Playgroud)
一旦插入一些文档并添加索引，WiredTiger 似乎确实创建了 LSM 文件。

db.test.insert([ { value: 1}, { value: 2}, { value: 3} ]) // Done in 16:04 db.test.createIndex( { value: 1 }, { storageEngine: { wiredTiger: {configString: "type=lsm"}}} ) // Done in 19:59
Run Code Online (Sandbox Code Playgroud)
$ ls -ltr ... -rw-r--r--. 1 mongod mongod 16384 Jan 15 16:04 collection-0-1708338433081558809-000002.lsm -rw-r--r--. 1 mongod mongod 16384 Jan 15 16:04 index-1-1708338433081558809.wt -rw-r--r--. 1 mongod mongod 16384 Jan 15 19:59 index-3-1708338433081558809-000002.lsm
Run Code Online (Sandbox Code Playgroud)
集合和索引value_1 …

indexing primary-key mongodb lsm-tree wiredtiger

aun*_*low

lucky-day

2
推荐指数

1
解决办法

2236
查看次数

为什么rocksDB需要多个级别？

RocksDB 1 级中的所有键都已排序。因此我们可以在这个关卡中快速获得钥匙。为什么rocksDB还需要将level 1的文件压缩到level 2呢？

我在 LevelDB 的文档上找到了一种解释：如果同一目录中的文件太多，则在一个目录中打开文件会很慢。但是，正如文档中提到的，我们可以使用分片来解决这个问题。我认为分片比压缩容易得多。我对吗？

提前致谢！

leveldb lsm-tree rocksdb

Yjy*_*eff

2021 07-08

2
推荐指数

1
解决办法

1016
查看次数

标签统计

lsm-tree ×5

indexing ×3

database ×2

key-value-store ×1

leveldb ×1

mongodb ×1

nosql ×1

primary-key ×1

range-query ×1

rocksdb ×1

wiredtiger ×1

术语 SSTable 和 LSM Tree 之间有什么区别

如何维护LSM树中的稀疏索引？

范围查询如何在 LSM（日志结构合并树）上工作？

MongoDB：如何更改 _id_ 索引的引擎类型（从 B-Tree 到 LSM-Tree）？

为什么rocksDB需要多个级别？

标签 统计

标签统计