new*_*eaf 11 attributes pyspark
我想知道df中所有不在df1中的项目,df1中的项目,但df中没有
df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
df2 = df.subtract(df1)
df2.show()
df3 = df1.subtract(df)
df3.show()
Run Code Online (Sandbox Code Playgroud)
只想检查结果,看看我是否理解这个功能.但得到这个错误'PipelinedRDD'对象没有属性'显示'任何建议?
Zha*_*ong 13
print(df2.take(10))
Run Code Online (Sandbox Code Playgroud)
df.show() 仅适用于spark DataFrame