Mat*_*Son 2 apply dataframe python-3.x pandas
我正在尝试将函数应用于 pandas 列,然后检索函数的属性。具体来说,我使用 TextBlob 从一列意见中提取情感和极性。
这是我尝试运行的示例代码。
opinion = ['good', 'bad','horrible']
df = pd.DataFrame(opinion, columns=['comment'])
df.head()
comment
0 good
1 bad
2 horrible
Run Code Online (Sandbox Code Playgroud)
我试图运行的伪代码是
from textblob import TextBlob
df['sentiment'] = df.comment.apply(TextBlob).sentiment
Run Code Online (Sandbox Code Playgroud)
这会引发 AttributeError。
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
in
----> 1 df.comment.apply(TextBlob).sentiment
~\AppData\Local\Continuum\miniconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
5177 if self._info_axis._can_hold_identifiers_and_holds_name(name):
5178 return self[name]
-> 5179 return object.__getattribute__(self, name)
5180
5181 def __setattr__(self, name, value):
AttributeError: 'Series' object has no attribute 'sentiment'
Run Code Online (Sandbox Code Playgroud)
我正在考虑使用getattr()函数来实现这一点,但它不起作用。
df.comment.apply(TextBlob).apply(getattr,sentiment)
Run Code Online (Sandbox Code Playgroud)
如何应用函数并获取列的属性?
您可以在此处使用attrgetter,这是“柯里化”版本getattr:
from operator import attrgetter
df.comment.apply(TextBlob).apply(attrgetter('sentiment'))Run Code Online (Sandbox Code Playgroud)
然而,如果TextBlob是“矢量化”,可能有一种更有效的方法来计算所有项目的情绪,但目前尚不清楚如何TextBlob实现。
| 归档时间: |
|
| 查看次数: |
1707 次 |
| 最近记录: |