ric*_*ier 1 python pattern-matching
我有一个数字列表.很多噪音中都有重复的模式.
样本数据:
(1,2,50,10,100,25,12,30,20,1,20,10,100,25,12,50,30,2,10,100,25,12,50,30,30,40,20,40,1,2,50,20,50,30,30,10,100,25,12,10,100,25,12)
Run Code Online (Sandbox Code Playgroud)
在这个例子中,所需的模式是10,100,25,12,但每次都会不同.
我如何找到任何重复模式?
后缀树是在字符串中查找重复子字符串的最有效解决方案.
以下是Python实现的一个示例:https://hkn.eecs.berkeley.edu/~dyoo/python/suffix_trees/
如果您不想打扰这样一个涉及的解决方案,您可以简单地遍历字符串,一次一个元素,并删除每个元素,如果它不是"10""100""25"或"12".最终,您将进入由"10""100""25"和"12"序列组成的第一个元素.
如果你的问题需要任何一般模式,你很可能想要使用后缀树,否则你会看到很大的时间复杂性.