避免Scala中的循环

zun*_*der 5 collections loops scala

我对Scala和整个函数式编程风格都很陌生.我需要做的是通过比较两个单词的每个字母来计算两个字符串之间的相似性.该函数将与相同长度的单词一起使用.

例如,"网络"和"锻炼"将具有相似度1."House"和"Mouse"将具有4的相似度.

这是我如何用一种非常老式的C#方式做到的:

int calculateCharSimilarity(string first, string second)
{
  int similarity = 0;
  for(int i = 0; i < first.lenght() && i < first.lenght(); i++)
  {
    if(first.charAt(i) == second.charAt(i))
      similarity++;
  }
  return similarity;
}
Run Code Online (Sandbox Code Playgroud)

到目前为止我在scala中所做的是编写一个尾递归函数以避免循环:

@tailrec
private def calculateCharSimilarity(first: Seq[Char], second: Seq[Char], similarity: Int = 0): Int = {
  if(first != Nil && second != Nil)
    calculateCharSimilarity(first.tail, second.tail, if(first.head == second.head) similarity + 1 else similarity)
  else
    similarity
}
Run Code Online (Sandbox Code Playgroud)

但我不确定这是否是Scala的最佳实践.有没有什么方法可以使用Collection Combinators(zip,filter)更优雅?

sen*_*nia 10

def charSimilarity(first: String, second: String) =
  (first.view zip second).count{case (a, b) => a == b}

charSimilarity("network", "workout")
// Int = 1

charSimilarity("House", "Mouse")
// Int = 4
Run Code Online (Sandbox Code Playgroud)

你可以view在这里放弃方法.在这种情况下,您将创建一个(Char, Char)大小的元组的新集合min(first.size, second.size).对于小字符串(单个字),您将不会遇到性能问题.

替代实施:

(first, second).zipped.count{case (a, b) => a == b}
Run Code Online (Sandbox Code Playgroud)

  • @PatrykĆwiek:我想`first.Zip(第二,(a,b)=> a == b).Count(t => t)`更好(没有不必要的`Tuple`创作,我只是不比如`ItemN`和`_N`方法). (3认同)