Nab*_*zir 2 python dataframe pandas pyspark
我是一个新的 spark 用户,之前我来自熊猫背景。这是我的 Spark 数据框
In[75]: spDF
Out[75]: DataFrame[customer_id: string, name: string]
Run Code Online (Sandbox Code Playgroud)
当我show
他们
In[75]: spDF.show()
Out[75]:
+-----------+-----------+
|customer_id| name|
+-----------+-----------+
| 25620| MCDonnalds|
| 25620| STARBUCKS|
| 25620| nan|
| 25620| nan|
| 25620| MCDonnalds|
| 25620| nan|
| 25620| MCDonnalds|
| 25620|DUNKINDONUT|
| 25620| LOTTERIA|
| 25620| nan|
| 25620| MCDonnalds|
| 25620|DUNKINDONUT|
| 25620|DUNKINDONUT|
| 25620| nan|
| 25620| nan|
| 25620| nan|
| 25620| nan|
| 25620| LOTTERIA|
| 25620| LOTTERIA|
| 25620| STARBUCKS|
+-----------+-----------+
only showing top 20 rows
Run Code Online (Sandbox Code Playgroud)
然后我尝试只查询列
In[76]: spDF['name']
Out[76]: Column<b'name'>
Run Code Online (Sandbox Code Playgroud)
但是当我向他们展示时,我收到以下错误。
In[79]: spDF['name'].show()
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-79-f6676d5e5ca2> in <module>()
----> 1 spDF['name'].show()
TypeError: 'Column' object is not callable
Run Code Online (Sandbox Code Playgroud)
任何人都有一个想法,这是什么错误?
归档时间: |
|
查看次数: |
17096 次 |
最近记录: |