在 Scala 中,根据与另一个元素的相似性来删除列表中元素的最有效方法是什么?

Gab*_*elG 2 loops scala list filter

我有一长串大约 300 个对象,列表中的每个对象都具有以下数据结构:

case class MyObject(id: String,
                    name: String,
                    colour: String,
                    price: Int
                    height: Int
                    width: Int,
                    desc: String)
Run Code Online (Sandbox Code Playgroud)

我无法确定浏览列表的最佳方式是什么,对于每个对象,删除具有相同名称、颜色、价格、高度和宽度的任何其他对象。请注意,这不是简单的重复数据删除,因为 ids 和 desc 可能不同。输入和输出需要保留List[MyObject],我事先不知道哪些对象是重复的。

这是我最初的解决方案,但不确定它是处理大列表时最有效的方法。

def removeDuplicates(originalList: List[MyObject]): List[MyObject] = {

  def loop(remaining: List[MyObject], acc: List[MyObject]): List[MyObject] = {
    remaining match {
      case head :: tail =>
        val listOfDuplicates = tail.filter{ x =>
          x.name == head.name &&
          x.colour == head.colour &&
          x.price == head.price &&
          x.height == head.height &&
          x.width == head.width
        }

        val deDupedTail = tail.filter(!listOfDuplicates.contains(_))

        loop(deDupedTail, acc ::: listOfDuplicates)
      case Nil => acc
    }
  }
  val listOfDuplicateObjects = loop(originalList, List())
  originalList.filter(!listOfDuplicateObjects.contains(_))
}
Run Code Online (Sandbox Code Playgroud)

amo*_*fis 6

不确定它是否最有效,但恕我直言,它很优雅:

originalList.distinctBy(o => (o.name, o.colour, o.price, o.height, o.width))
Run Code Online (Sandbox Code Playgroud)