如何在 Haskell 中制作开始/结束索引列表?

Mam*_*nda 5 string haskell substring list-comprehension list

我正在尝试创建一个 Haskell 函数,它接受两个字符串作为参数,第一个是我们想要在第二个参数中定位的字符串,并返回一个元组列表,其中包含每次出现的开始和结束索引。例如,

indexTuples :: String -> String -> [(Int, Int)]
indexTuples "aa" "foobaarfoobaar" 

Output: [(4,5), (11,12)] 
Run Code Online (Sandbox Code Playgroud)

到目前为止,我已经制作了一个查找索引的帮助函数(我试图不使用除 Prelude 方法之外的任何额外方法,而是自己实现)。

我的辅助函数接受一个字符串和一个字符并返回索引,如下所示:

findPos :: (Num a1, Enum a1, Eq a2) => [a2] -> a2 -> [a1]
findPos str c = [index | (x, index) <- zip str [0..], x == c]
Run Code Online (Sandbox Code Playgroud)

(我在这里找到了这个解决方案。)该函数将带有无限数字列表的字符串压缩为元组,然后选择字符等于参数的元组c并返回每个元组的索引。这给了我这个输出:

Ok, one module loaded.
ghci> findPos "blablabla" 'b'
[0,3,6]
Run Code Online (Sandbox Code Playgroud)

但我该如何做到这一点,以便它接受两个字符串呢?像这样:

ghci> findPos "blablabla" "bl" 
[(0,1), (3,4), (6,7)] 
Run Code Online (Sandbox Code Playgroud)

我尝试将cchar 对象更改为字符串对象,但随后在ghci.

Wil*_*ess 1

(非空)字符串有一个头元素 a Char

indexTuples :: String -> String -> [(Int, Int)]
indexTuples []     _   = []
indexTuples (c:cs) str =
Run Code Online (Sandbox Code Playgroud)

在另一个字符串中找到它的索引后,--所有出现的字符串的列表findPos,--使用您已有的函数,

  let
    ixs = findPos str c
Run Code Online (Sandbox Code Playgroud)

我们每一个都尝试一下

    len = length cs
    fits = [ (i,i+len) | i <- ixs, cs == (take len $ drop i str)]
Run Code Online (Sandbox Code Playgroud)

这就是我们的答案。

   in
      fits
Run Code Online (Sandbox Code Playgroud)

  • 你不应该写,而应该复制和粘贴。我在 GHCi 中尝试了我的代码,没有错误。“drop 1”是错误的,它不应该在那里。但这会被认为是一个差一错误。:) (2认同)