如何根据CaseObj的属性使List [CaseObj]不同?

use*_*744 2 compare scala equals case-class

通常我在List上调用distinct来删除重复项或将其转换为Set.现在我有了List[MyObject].MyObject是一个案例类,见下文:

case class MyObject(s1: String, s2:String, s3:String) 
Run Code Online (Sandbox Code Playgroud)

假设我们有以下情况:

val myObj1 = MyObject("", "gmail,com", "some text")
val myObj2 = MyObject("", "gmail,com", "")
val myObj3 = MyObject("some text", "gmail.com", "")
val myObj4 = MyObject("some text", "gmail.com", "some text")
val myObj5 = MyObject("", "ymail.com", "")
val myObj6 = MyObject("", "ymail.com", "some text")

val myList = List(myObj1, myObj2, myObj3, myObj4, myObj5, myObj6)
Run Code Online (Sandbox Code Playgroud)

两个问题:

  1. 如何计算受影响的对象数量?根据内容重复s2
  2. 如何根据列表区分s2?我认为两个案例对象相同s2 == s2.我是否需要将case类转换为普通类并覆盖equals?我是否需要一个自己的比较器,或者我可以使用一些Scala API方法来存档它吗?

Yuv*_*kov 6

如何计算受影响的对象数量?基于s2的内容重复?

如果要计算每个重复组中有多少个对象(如果您只想知道要删除多少个对象,请从大小中减去1):

myList.groupBy(_.s2).map(x => (x._1, x._2.size))
res0: scala.collection.immutable.Map[String,Int] = Map(ymail.com -> 2, gmail.com -> 2, gmail,com -> 2)
Run Code Online (Sandbox Code Playgroud)

如何根据s2使List清楚?

myList.groupBy(_.s2).map(_._2.head)
res1: scala.collection.immutable.Iterable[MyObject] = List(MyObject(,ymail.com,), MyObject(some text,gmail.com,), MyObject(,gmail,com,some text))
Run Code Online (Sandbox Code Playgroud)