Pyspark RDD .filter()带有通配符

Luc*_*tos 7 python apache-spark rdd

我有一个带有文本列的Pyspark RDD我想用作过滤器,所以我有以下代码:

table2 = table1.filter(lambda x: x[12] == "*TEXT*")
Run Code Online (Sandbox Code Playgroud)

问题是......正如你所看到的那样,我*试图告诉他将其解释为通配符,但没有成功.任何人都有帮助吗?

Dav*_*vid 11

lambda函数是纯python,所以下面的东西可以工作

table2 = table1.filter(lambda x: "TEXT" in x[12])
Run Code Online (Sandbox Code Playgroud)