标签: radix-tree

trie和radix trie数据结构有什么区别？

是特里和基数特里数据结构是一回事吗？

如果它们相同,那么radix trie(AKA Patricia trie)的含义是什么？

algorithm tree patricia-trie data-structures radix-tree

Dag*_*unt

2015 11-15

84
推荐指数

4
解决办法

4万
查看次数

Trie实施

我试图在Java中实现一个非常简单的Trie,支持3个操作.我希望它有一个insert方法,一个has方法(即trie中的某个单词),以及一个以字符串形式返回trie的toString方法.我相信我的插入工作正常,但是并且toString被证明是困难的.这是我到目前为止所拥有的.

特里班.


public class CaseInsensitiveTrie implements SimpleTrie {

    //root node
    private TrieNode r;

    public CaseInsensitiveTrie() {
        r = new TrieNode();
    }

    public boolean has(String word) throws InvalidArgumentUosException {
        return r.has(word);
    }

    public void insert(String word) throws InvalidArgumentUosException {
        r.insert(word);
    }

    public String toString() {
        return r.toString();
    }

    public static void main(String[] args) {

        CaseInsensitiveTrie t = new CaseInsensitiveTrie();

        System.out.println("Testing some strings");
        t.insert("TEST");
        t.insert("TATTER");
        System.out.println(t.has("TEST"));
    }
}

Run Code Online (Sandbox Code Playgroud)

和节点类


public class TrieNode {

    //make child nodes
    private TrieNode[] c;
    //flag for end …

Run Code Online (Sandbox Code Playgroud)

java abstract-data-type trie radix radix-tree

dc.*_*dc.

2019 03-26

14
推荐指数

2
解决办法

3万
查看次数

如何遍历linux内核中的文件地址空间的页面缓存树(基数树)

我需要获取打开文件的页面缓存统计信息.文件结构中有一个address_space指针(f_mapping),它又具有名为page_tree的基数树的根.我需要遍历该树以获取有关该打开文件的所有缓存页面的信息.

有一些函数,如radix_tree_for_each_chunk(迭代块),radix_tree_for_each_chunk_slot(迭代一个块中的插槽)等,使用这些功能可以实现.我不确定它的正确用法(参数).如果发布任何示例,将会很有帮助.

linux caching linux-kernel radix-tree

Sus*_*rya

lucky-day

6
推荐指数

1
解决办法

576
查看次数

"板蓝根"一词在基数树中的意义

虽然很难找到"基数树"的一致定义,但大多数公认的基数树定义表明它是一个压缩的前缀树.我正在努力理解的是在这种情况下术语"基数"的重要性.为什么压缩的前缀树如此命名(即Radix Tree),而非压缩的前缀树不称为Radix Tree？

tree patricia-trie data-structures radix-tree

KGh*_*tak

2016 10-25

6
推荐指数

1
解决办法

460
查看次数

如何创建，更新和读取不适合内存的基数树？

我对使用基数树（或Patricia trie）存储的哈希/字典/数组感兴趣strings -> values。但是，我发现我有太多的字符串无法容纳到内存中。

我发现Algolia撰写了一篇文章，介绍了他们如何通过搜索索引解决此问题，他们谈论了我正在尝试做的事情：在构建每个分支时将基数树刷新到磁盘上，并且仅读回所需的分支。

但是，他们没有提及他们如何做到这一点。我想到存储基数树的唯一方法是作为完整的（序列化的）对象或作为简单的键/值存储的哈希/数组。

例如，使用键/值存储

SET smile:  [...values...]
SET smiled: [...values...]
SET smiles:  [...values...]
SET smiling: [...values...]

Run Code Online (Sandbox Code Playgroud)

然后进行前缀扫描以提取出的键/值MATCH smil*。但是，这种损失失去了基数树的节省空间的好处，另外，它还需要在负载下重建至少一部分基数树。

memory trie patricia-trie radix-tree

Xeo*_*oss

lucky-day

6
推荐指数

1
解决办法

101
查看次数

基数树的空间复杂度是多少？

我一直关注基数树的空间使用,但我没有找到任何有用的讨论.

现在假设我们有一个与linux radix-tree.c相同的基数树实现,它接受一个整数并使用每6位来索引树中的下一个位置.我可以很容易地想到基数树的空间使用远远超过二叉搜索树的情况.如果我错了,请纠正我:

使用案例:(0,1,1,1,1),(1,1,1,1,1),(2,1,1,1,1),......(63,1,1,1) ,1).

这里只是为了方便起见,我使用(a,b,c,d,e)来表示一个30位整数键,每个元素代表一个6位值.a是MSB,e是LSB.

基数树:

对于这个用例,基数树的高度为5,每个密钥将占用4个独立的节点,因为它们位于根的不同子树上.所以会有((5-1)*64 + 1)= 257个节点.

每个节点包含2 ^ 6 = 64个指针,因此它将使用257*64*4Byte = 65KB

二叉搜索树

我们只关心有多少钥匙.在这种情况下,它有64个键.

假设每个BST节点每个节点使用3个指针,它将使用64*3*4Byte = 768字节.

对照

看起来基数树空间效率很低.在给定相同数量的节点的情况下,它比二叉搜索树使用~100倍的空间!我不明白为什么它甚至在linux内核中使用.

我错过了什么吗？谢谢.

c tree linux-kernel radix-tree

Jun*_*Jun

lucky-day

6
推荐指数

1
解决办法

2845
查看次数

具有可变长度符号的霍夫曼编码

我正在考虑使用霍夫曼代码来压缩文本，但使用可变长度的符号（字符串）。例如（使用下划线作为空格）：

huffman-code | symbol
------------------------------------
00           | _
01           | E
100          | THE
101          | A
1100         | UP
1101         | DOWN
11100        | .
11101        |
1111...
(etc...)

Run Code Online (Sandbox Code Playgroud)

如何构建频率表？显然存在一些重叠问题，序列_TH出现的频率几乎与一样THE，但在表中毫无用处（_和THE都有短霍夫曼代码）。

这样的算法存在吗？它有一个特殊的名字吗？生成频率表有哪些技巧？我需要对输入进行标记吗？我在文献/网络中没有找到任何内容。（所有这些让我也想到了基数树）。

我正在考虑使用迭代过程：