如何在没有分组依据的情况下连接pandas中数据帧的列的所有行

Question

如何在没有分组依据的情况下连接pandas中数据帧的列的所有行

sar*_*iii 5 python concatenation dataframe pandas

我有一个像这样的数据框

已经服用 12 天，同时服用 60 毫克百忧解 4 年多了。索引句

  1   I feel the best I have felt in years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  2   "I have taken for over 7 years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  
  3   I slept 2 hours".                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  4   IT SAVED MY LIFE                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  5   IT SAVED MY LIFE"

Run Code Online (Sandbox Code Playgroud)

然后我想将它们连接在一个数组中。问题是，可能有一些句子重复，但我仍然想保留所有句子，所以结果将是：

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]

Run Code Online (Sandbox Code Playgroud)

我已经尝试过这个链接和这个都在r中。

我也尝试过这种方法：

dfsent.groupby(['sentences']).apply(','.join)

Run Code Online (Sandbox Code Playgroud)

但由于我的数据框中的某些行是重复的，因此它只给了我其中之一。以我的例子为例，请返回以下内容：

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]

Run Code Online (Sandbox Code Playgroud)

提前致谢：）

Answer 1

Ste*_*ven 8

如果您想要的只是在 Pandas 数据框中的列中生成所有值（唯一或不唯一）的列表，则更简单的方法是使用该.tolist()方法。

因此，dfsent['sentences'].tolist()会产生所需的输出。

归档时间：	7 年，5 月前
查看次数：	18749 次
最近记录：	7 年，5 月前