显示单个火花列时,“Column”对象不可调用

Nab*_*zir 2 python dataframe pandas pyspark

我是一个新的 spark 用户,之前我来自熊猫背景。这是我的 Spark 数据框

In[75]:  spDF
Out[75]: DataFrame[customer_id: string, name: string]
Run Code Online (Sandbox Code Playgroud)

当我show他们

In[75]:  spDF.show()
Out[75]:

+-----------+-----------+
|customer_id|       name|
+-----------+-----------+
|      25620| MCDonnalds|
|      25620|  STARBUCKS|
|      25620|        nan|
|      25620|        nan|
|      25620| MCDonnalds|
|      25620|        nan|
|      25620| MCDonnalds|
|      25620|DUNKINDONUT|
|      25620|   LOTTERIA|
|      25620|        nan|
|      25620| MCDonnalds|
|      25620|DUNKINDONUT|
|      25620|DUNKINDONUT|
|      25620|        nan|
|      25620|        nan|
|      25620|        nan|
|      25620|        nan|
|      25620|   LOTTERIA|
|      25620|   LOTTERIA|
|      25620|  STARBUCKS|
+-----------+-----------+
only showing top 20 rows
Run Code Online (Sandbox Code Playgroud)

然后我尝试只查询列

In[76]:  spDF['name']
Out[76]: Column<b'name'>
Run Code Online (Sandbox Code Playgroud)

但是当我向他们展示时,我收到以下错误。

In[79]: spDF['name'].show()
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-79-f6676d5e5ca2> in <module>()
----> 1 spDF['name'].show()

TypeError: 'Column' object is not callable
Run Code Online (Sandbox Code Playgroud)

任何人都有一个想法,这是什么错误?

Cha*_*Ray 9

尝试

所以 spDF.select('colname').show()