Luc*_*tos 7 python apache-spark rdd
我有一个带有文本列的Pyspark RDD我想用作过滤器,所以我有以下代码:
table2 = table1.filter(lambda x: x[12] == "*TEXT*")
Run Code Online (Sandbox Code Playgroud)
问题是......正如你所看到的那样,我*试图告诉他将其解释为通配符,但没有成功.任何人都有帮助吗?
Dav*_*vid 11
lambda函数是纯python,所以下面的东西可以工作
table2 = table1.filter(lambda x: "TEXT" in x[12])
Run Code Online (Sandbox Code Playgroud)