Pandas 将函数应用于列然后获取属性

Mat*_*Son 2 apply dataframe python-3.x pandas

我正在尝试将函数应用于 pandas 列,然后检索函数的属性。具体来说,我使用 TextBlob 从一列意见中提取情感和极性。

这是我尝试运行的示例代码。

opinion = ['good', 'bad','horrible']
df = pd.DataFrame(opinion, columns=['comment'])
df.head()
    comment
0   good
1   bad
2   horrible
Run Code Online (Sandbox Code Playgroud)

我试图运行的伪代码是

from textblob import TextBlob
df['sentiment'] = df.comment.apply(TextBlob).sentiment
Run Code Online (Sandbox Code Playgroud)

这会引发 AttributeError。

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
 in 
----> 1 df.comment.apply(TextBlob).sentiment

~\AppData\Local\Continuum\miniconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
   5177             if self._info_axis._can_hold_identifiers_and_holds_name(name):
   5178                 return self[name]
-> 5179             return object.__getattribute__(self, name)
   5180 
   5181     def __setattr__(self, name, value):

AttributeError: 'Series' object has no attribute 'sentiment'
Run Code Online (Sandbox Code Playgroud)

我正在考虑使用getattr()函数来实现这一点,但它不起作用。

df.comment.apply(TextBlob).apply(getattr,sentiment)
Run Code Online (Sandbox Code Playgroud)

如何应用函数并获取列的属性?

Wil*_*sem 5

您可以在此处使用attrgetter,这是“柯里化”版本getattr

from operator import attrgetter

df.comment.apply(TextBlob).apply(attrgetter('sentiment'))
Run Code Online (Sandbox Code Playgroud)

然而,如果TextBlob是“矢量化”,可能有一种更有效的方法来计算所有项目的情绪,但目前尚不清楚如何TextBlob实现。