我正在寻找一个Python库,用于从一组字符串中查找最长的公共子字符串.有两种方法可以解决这个问题:
实施的方法并不重要.重要的是它可以用于一组字符串(不仅仅是两个字符串).
我有两个字符串.为了示例,它们设置如下:
string1="test toast"
string2="test test"
Run Code Online (Sandbox Code Playgroud)
我想要的是从字符串的开头找到重叠.对于重叠,我的意思是上面例子中的字符串"test t".
# So I look for the command
command "$string1" "$string2"
# that outputs:
"test t"
Run Code Online (Sandbox Code Playgroud)
如果字符串是,string1="atest toast"; string2="test test"它们将没有重叠,因为检查从开头开始,而"a"在开头string1.
在过去的几天里,我对此进行了广泛的研究,我已经阅读了很多东西,以至于我现在更加困惑.如何在大型数据集中找到最长的公共子字符串?我们的想法是从这个数据集中删除重复的内容(长度不同,因此算法需要连续运行).通过大数据集,我的意思是大约100mb的文本.
后缀树?后缀数组?拉宾,卡普?什么是最好的方式?那里有一个可以帮助我的图书馆吗?
真的希望有一个好的回应,我的头很痛.谢谢!:-)
我正在实现一个AJAX自动完成/自动提示功能,我不仅要做与用户输入类似的常用显示建议,而且我想让用户进行部分完成以节省输入.
因此,想象一下我的词典中有这些价值:"青苹果","绿色梨","绿色水果","蓝天","蓝色水","蓝色唤醒".
如果用户键入"g",建议应该是"青苹果","绿色梨","绿色水果",我想让用户点击TAB或其他东西将他的查询更新为"绿色",然后他们可以输入"a",他们就会完成"青苹果".
我试图在linux shell命令行完成后对此进行建模.
你能推荐一个这样做的控件/脚本吗?或者对现有控件进行修改/定制?
有没有类似的东西make.path.relative(base.path, target.path)?
我想将完整路径转换为给定基本路径的相对路径(如项目的目录)。
这个问题只是要求在R中实现以下问题:在一组字符串中找到最长的公共起始子字符串(JavaScript)
" 这个问题是最长公共子串问题的一个更具体的例子.我只需要在数组中找到最长的公共起始子串 ".
所以我只是看一个这个问题的R实现(最好不是在 JavaScript版本中建议的for/while循环方式),如果可能的话我想把它作为一个函数包装起来,所以我可以在很多组中应用数据表.
经过一些搜索,我找不到一个R的例子,因此这个问题.
示例数据:我有以下字符向量:
dput(data)
c("ADA4417-3ARMZ-R7", "ADA4430-1YKSZ-R2", "ADA4430-1YKSZ-R7",
"ADA4431-1YCPZ-R2", "ADA4432-1BCPZ-R7", "ADA4432-1BRJZ-R2")
Run Code Online (Sandbox Code Playgroud)
我想在R中运行一个算法,它将找到以下输出:ADA44.
从我在JavaScript接受的答案中看到的,我们的想法是首先对向量进行排序,提取第一个和最后一个元素(例如:"ADA4417-3ARMZ-R7"和"ADA4432-1BRJZ-R2"它们分成单个字符,并循环遍历它们,直到其中一个字符为'匹配(希望我对)
对此的任何帮助都会很棒!
假设我有字符串数组:
["A12[1]", "A13[1]", "A14[1]"]
我需要找到最长的公共前缀A1和后缀[1]。
其他例子:
["9-b", "10-b", "11-b"]-> 后缀-b,无前缀
["A12", "A14", "A6"]-> 前缀A,无后缀
如何遍历数组以查找数组中每个字符串的结尾和开头?
string ×3
r ×2
ajax ×1
algorithm ×1
autocomplete ×1
bash ×1
ios ×1
javascript ×1
large-files ×1
path ×1
python ×1
suffix-tree ×1
swift ×1