我是Apache Spark的新手,正在学习基本的功能.有一个小小的疑问.假设我有一个元组的RDD(键,值),并希望从中获得一些独特的元素.我使用distinct()函数.我想知道函数在什么基础上认为元组是完全不同的?它是基于键,值,还是两者兼而有之?
distinct apache-spark
apache-spark ×1
distinct ×1