sar*_*iii 5 python concatenation dataframe pandas
我有一个像这样的数据框
已经服用 12 天,同时服用 60 毫克百忧解 4 年多了。索引句
1 I feel the best I have felt in years.
2 "I have taken for over 7 years.
3 I slept 2 hours".
4 IT SAVED MY LIFE
5 IT SAVED MY LIFE"
Run Code Online (Sandbox Code Playgroud)
然后我想将它们连接在一个数组中。问题是,可能有一些句子重复,但我仍然想保留所有句子,所以结果将是:
["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]
Run Code Online (Sandbox Code Playgroud)
我也尝试过这种方法:
dfsent.groupby(['sentences']).apply(','.join)
Run Code Online (Sandbox Code Playgroud)
但由于我的数据框中的某些行是重复的,因此它只给了我其中之一。以我的例子为例,请返回以下内容:
["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]
Run Code Online (Sandbox Code Playgroud)
提前致谢 :)
如果您想要的只是在 Pandas 数据框中的列中生成所有值(唯一或不唯一)的列表,则更简单的方法是使用该.tolist()方法。
因此,dfsent['sentences'].tolist()会产生所需的输出。