the*_*tom 9 scala apache-spark
我可以使用"contains"过滤 - 如下所示 - RDD中的元组.但是如何使用"不包含"过滤RDD呢?
val rdd2 = rdd1.filter(x => x._1 contains ".")
Run Code Online (Sandbox Code Playgroud)
我找不到这个的语法.假设有可能并且我没有使用DataFrames.我无法看到如何使用正则表达式和/或过滤器示例.
eli*_*sah 19
这只是否定了的contains过滤谓词:
val rdd2 = rdd1.filter(x => !(x._1 contains "."))
Run Code Online (Sandbox Code Playgroud)