小编dat*_*ana的帖子

在行上应用的几何平均值

我有这个数据框作为例子:

Col1       Col2       Col3       Col4
   1          2          3        2.2
Run Code Online (Sandbox Code Playgroud)

我想添加一个名为'Gmean'的第4列,用于计算每行前3列的几何平均值.

怎么能完成它?

谢谢!

python numpy scipy pandas

6
推荐指数
1
解决办法
4501
查看次数

在熊猫中添加天数

我有一个包含2列的数据框,一个是Date,另一个是float number.我想添加这些2以获得以下内容:

   Index           Date           Days           NewDate
     0           20-04-2016        5           25-04-2016
     1           16-03-2015       3.7          20-03-2015
Run Code Online (Sandbox Code Playgroud)

如您所见,如果有小数,则将其转换为int - 3.1 - > 4(天).我有一些奇怪的问题,所以我感谢任何帮助.谢谢 !

python datetime numpy date pandas

5
推荐指数
2
解决办法
1万
查看次数

用熊猫读取日志文件

我有一个日志文件,尝试使用read_csv或read_table在熊猫中读取。我有以下结果示例:

0    date=2015-09-17    time=21:05:35     duration=0    etc...
Run Code Online (Sandbox Code Playgroud)

在1列上。

我想拆分每一行,获取名称(如日期,时间等),然后将其转换为列,这样我将得到:

          date           time     duration   ...
  0    2015-09-17      21:05:35      0              
Run Code Online (Sandbox Code Playgroud)

谢谢 !

python database logging dataframe pandas

5
推荐指数
1
解决办法
6130
查看次数

按条件填充列

我有一个包含 2 列的数据框:

          Col1          Col2
1          NaN         Someval1
2           Y          Someval2
3           N          Someval3
4          NaN           NaN
5          NaN         Someval4
Run Code Online (Sandbox Code Playgroud)

我想用以下条件填充 NaN:

If Col1 has NaN and Col2 has a Someval1 that is in list 1 then fillna with Y
If Col1 has NaN and Col2 has a Someval4 that is in list 2 then fillna with N
If Col1 has NaN and Col2 has a NaN that is in list 2 then fillna with N
Run Code Online (Sandbox Code Playgroud)

有什么建议 ?(不知道可不可以)

非常感谢 !

python numpy dataframe pandas

4
推荐指数
1
解决办法
8040
查看次数

整天蟒蛇分组

我有一个Dataframe将其更改为时间序列.日期范围从2013年到2017年.我想按小时分组所有数据.例如,所有星期一在一起,每小时一次,然后是所有星期二.最后我会有168(24*7)行.这样做的最佳方法是什么?

重新采样后我有这个样本:

2017-01-17 00:00:00    NaN
2017-01-17 01:00:00    NaN
2017-01-17 02:00:00    NaN
2017-01-17 03:00:00    NaN
2017-01-17 04:00:00    1.0
2017-01-17 05:00:00    NaN
2017-01-17 06:00:00    NaN
2017-01-17 07:00:00    NaN
2017-01-17 08:00:00    NaN
2017-01-17 09:00:00    1.0
2017-01-17 10:00:00    3.0
2017-01-17 11:00:00    3.0
2017-01-17 12:00:00    3.0
2017-01-17 13:00:00    5.0
2017-01-17 14:00:00    2.0
2017-01-17 15:00:00    1.0
2017-01-17 16:00:00    2.0
2017-01-17 17:00:00    1.0
2017-01-17 18:00:00    1.0
2017-01-17 19:00:00    1.0
2017-01-17 20:00:00    NaN
2017-01-17 21:00:00    NaN
2017-01-17 22:00:00    NaN
2017-01-17 23:00:00    NaN        
2017-01-24 10:00:00    14.0
2017-01-24 11:00:00    14.0 …
Run Code Online (Sandbox Code Playgroud)

python time-series python-3.x pandas

3
推荐指数
1
解决办法
85
查看次数