我试图以简洁的方式存储大量字符串,以便可以非常快速地分析/搜索它们.
有向无环字图(DAWG)非常适合这个目的.但是,我没有首先要包含的字符串列表,因此必须以增量方式构建.另外,当我搜索一个字符串时,我需要带回与结果相关的数据(不仅仅是一个布尔说,如果它存在).
我在这里找到了有关字符串数据跟踪的DAWG修改的信息:http://www.pathcom.com/~vadco/adtdawg.html它看起来非常非常复杂,我不确定我是否有能力编写它.
我还发现了一些描述增量构建算法的研究论文,尽管我发现一般来说研究论文并不是很有帮助.
我认为我不够先进,无法自己将这两种算法结合起来.是否有已经具备这些功能的算法的文档,或者具有良好内存使用和速度的替代算法?