我是 pyspark 的新手。我在pyspark中写了这段代码:
def filterOut2(line):
return [x for x in line if x != 2]
filtered_lists = data.map(filterOut2)
Run Code Online (Sandbox Code Playgroud)
但我收到此错误:
'list' object has no attribute 'map'
Run Code Online (Sandbox Code Playgroud)
如何map
在 PySpark 中专门对我的数据执行操作,以允许我将数据过滤为仅那些条件评估为真的值?