我有一个Pandas数据框,其中一列包含文本.我想得到整个列中出现的唯一单词列表(空格是唯一的分割).
import pandas as pd
r1=['My nickname is ft.jgt','Someone is going to my place']
df=pd.DataFrame(r1,columns=['text'])
Run Code Online (Sandbox Code Playgroud)
输出应如下所示:
['my','nickname','is','ft.jgt','someone','going','to','place']
Run Code Online (Sandbox Code Playgroud)
获得计数也没有什么坏处,但并不是必需的.
我有一个包含大约 4000 个客户问题的数据集。我想知道客户问得最多的话题。我没有主题列表。我想获得该列中所有单词的字数。
数据位于熊猫数据框中。