如何在没有分组依据的情况下连接pandas中数据帧的列的所有行

sar*_*iii 5 python concatenation dataframe pandas

我有一个像这样的数据框

已经服用 12 天,同时服用 60 毫克百忧解 4 年多了。索引句

  1   I feel the best I have felt in years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  2   "I have taken for over 7 years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  
  3   I slept 2 hours".                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  4   IT SAVED MY LIFE                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  5   IT SAVED MY LIFE" 
Run Code Online (Sandbox Code Playgroud)

然后我想将它们连接在一个数组中。问题是,可能有一些句子重复,但我仍然想保留所有句子,所以结果将是:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]
Run Code Online (Sandbox Code Playgroud)

我已经尝试过这个链接这个都在r中。

我也尝试过这种方法:

dfsent.groupby(['sentences']).apply(','.join)
Run Code Online (Sandbox Code Playgroud)

但由于我的数据框中的某些行是重复的,因此它只给了我其中之一。以我的例子为例,请返回以下内容:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]
Run Code Online (Sandbox Code Playgroud)

提前致谢 :)

Ste*_*ven 8

如果您想要的只是在 Pandas 数据框中的列中生成所有值(唯一或不唯一)的列表,则更简单的方法是使用该.tolist()方法。

因此,dfsent['sentences'].tolist()会产生所需的输出。