Pyspark的'PipelinedRDD'对象没有属性'show'

new*_*eaf 11 attributes pyspark

我想知道df中所有不在df1中的项目,df1中的项目,但df中没有

    df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
    df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
    df2 = df.subtract(df1)
    df2.show()
    df3 = df1.subtract(df)
    df3.show()
Run Code Online (Sandbox Code Playgroud)

只想检查结果,看看我是否理解这个功能.但得到这个错误'PipelinedRDD'对象没有属性'显示'任何建议?

Zha*_*ong 13

print(df2.take(10))
Run Code Online (Sandbox Code Playgroud)

df.show() 仅适用于spark DataFrame

  • 如何转换为火花数据帧? (2认同)