我有这个数据框作为例子:
Col1 Col2 Col3 Col4
1 2 3 2.2
Run Code Online (Sandbox Code Playgroud)
我想添加一个名为'Gmean'的第4列,用于计算每行前3列的几何平均值.
怎么能完成它?
谢谢!
我有一个包含2列的数据框,一个是Date,另一个是float number.我想添加这些2以获得以下内容:
Index Date Days NewDate
0 20-04-2016 5 25-04-2016
1 16-03-2015 3.7 20-03-2015
Run Code Online (Sandbox Code Playgroud)
如您所见,如果有小数,则将其转换为int - 3.1 - > 4(天).我有一些奇怪的问题,所以我感谢任何帮助.谢谢 !
我有一个日志文件,尝试使用read_csv或read_table在熊猫中读取。我有以下结果示例:
0 date=2015-09-17 time=21:05:35 duration=0 etc...
Run Code Online (Sandbox Code Playgroud)
在1列上。
我想拆分每一行,获取名称(如日期,时间等),然后将其转换为列,这样我将得到:
date time duration ...
0 2015-09-17 21:05:35 0
Run Code Online (Sandbox Code Playgroud)
谢谢 !
我有一个包含 2 列的数据框:
Col1 Col2
1 NaN Someval1
2 Y Someval2
3 N Someval3
4 NaN NaN
5 NaN Someval4
Run Code Online (Sandbox Code Playgroud)
我想用以下条件填充 NaN:
If Col1 has NaN and Col2 has a Someval1 that is in list 1 then fillna with Y
If Col1 has NaN and Col2 has a Someval4 that is in list 2 then fillna with N
If Col1 has NaN and Col2 has a NaN that is in list 2 then fillna with N
Run Code Online (Sandbox Code Playgroud)
有什么建议 ?(不知道可不可以)
非常感谢 !
我有一个Dataframe将其更改为时间序列.日期范围从2013年到2017年.我想按小时分组所有数据.例如,所有星期一在一起,每小时一次,然后是所有星期二.最后我会有168(24*7)行.这样做的最佳方法是什么?
重新采样后我有这个样本:
2017-01-17 00:00:00 NaN
2017-01-17 01:00:00 NaN
2017-01-17 02:00:00 NaN
2017-01-17 03:00:00 NaN
2017-01-17 04:00:00 1.0
2017-01-17 05:00:00 NaN
2017-01-17 06:00:00 NaN
2017-01-17 07:00:00 NaN
2017-01-17 08:00:00 NaN
2017-01-17 09:00:00 1.0
2017-01-17 10:00:00 3.0
2017-01-17 11:00:00 3.0
2017-01-17 12:00:00 3.0
2017-01-17 13:00:00 5.0
2017-01-17 14:00:00 2.0
2017-01-17 15:00:00 1.0
2017-01-17 16:00:00 2.0
2017-01-17 17:00:00 1.0
2017-01-17 18:00:00 1.0
2017-01-17 19:00:00 1.0
2017-01-17 20:00:00 NaN
2017-01-17 21:00:00 NaN
2017-01-17 22:00:00 NaN
2017-01-17 23:00:00 NaN
2017-01-24 10:00:00 14.0
2017-01-24 11:00:00 14.0 …Run Code Online (Sandbox Code Playgroud)