小编M_S*_*S_N的帖子

在 Pandas 中查询 timedelta 列，并过滤行

我在熊猫中有一个 timedelta 列。它的格式为 x 天 00:00:00。我想过滤掉并标记值 >=30 分钟的行。我不知道如何使用熊猫来做到这一点。我尝试了布尔值和 if 语句，但没有用。任何帮助，将不胜感激。

filtering timedelta pandas

use*_*055

2019 11-27

8
推荐指数

1
解决办法

4906
查看次数

如何根据列值使用绘图分配颜色值？

我正在尝试使用plotly 绘制k 均值簇，但我在根据这些组分配颜色时遇到困难？我有以下数据框。

group：簇号

我用它来绘制散点图。

clustered.iplot(kind='scatter',x='value1',y='value2', colors = {'[clustered['group']==1]':'green', '[clustered['group']==0]':'yellow'},mode='markers',size=10)

Run Code Online (Sandbox Code Playgroud)

这是错误的，因为它只会为颜色字典对象获取 True 和 false。我如何关联这些组值，以便点的颜色在图中显示不同。

python plotly

M_S*_*S_N

lucky-day

6
推荐指数

1
解决办法

9149
查看次数

SQL 查找过去 12 个月内连续月份的最大数量

我正在尝试在 sql 中编写一个查询，我需要找到最大编号。过去 12 个月（不包括 6 月和 7 月）的连续月份数。

例如我有一个初始表如下

+---------+--------------+-----------+------------+
|      id | Payment      |  amount   |    Date    |
+---------+--------------+-----------+------------+
|       1 | CJ1          |     70000 | 11/3/2020  |
|       1 | 1B4          |  36314000 | 12/1/2020  |
|       1 | I21          | 119439000 | 1/12/2021  |
|       1 | 0QO          |   9362100 | 2/2/2021   |
|       1 | 1G0          | 140431000 | 2/23/2021  |
|       1 | 1G           |   9362100 | 3/2/2021   |
|       1 | g5d          | …

Run Code Online (Sandbox Code Playgroud)

sql gaps-and-islands

M_S*_*S_N

2022 01-22

6
推荐指数

1
解决办法

699
查看次数

查找多索引数据框的每个级别的最大值

我有一个看起来像这样的DataFrame:

        data
a   b
1   1   0.1
    2   0.2
    3   0.3
2   1   0.5
    2   0.6
    3   0.7

Run Code Online (Sandbox Code Playgroud)

我想找到每个级别a忽略b级别的最小值,所以作为输出我正在寻找类似的东西

a   min
1   0.1
2   0.5

Run Code Online (Sandbox Code Playgroud)

python pandas

Dav*_*sby

2019 10-15

4
推荐指数

1
解决办法

2415
查看次数

Python:为什么我无法将地图对象转换为列表

我在将地图转换为列表时遇到问题,当它可以转换为设置时

list_nums_2 = [2, 4, 5, 9, 8, 7, 6, 3, 1, 0]
evens = filter(lambda a: a % 2 == 0, list_nums_2)
print(set(evens))  # Out: {0, 2, 4, 6, 8}
print(list(evens)) # Out: []

Run Code Online (Sandbox Code Playgroud)

我知道这不是因为它已经从下面转换为设置,很明显set可以转换为list

set_1 = {2, 3, 4, 5, 6}

print(list(set_1))  # Out: [2, 3, 4, 5, 6]

Run Code Online (Sandbox Code Playgroud)

python python-3.x

M_S*_*S_N

2019 02-12

3
推荐指数

1
解决办法

333
查看次数

pandas groupby 并用另一列的第一个值减去一列的最后一个值

我正在尝试添加一个新列，其中包含一列的第一个值与另一列的最后一个值之间的差异我正在使用此命令

df['diff']=df.groupby(['T_Id'])['EndMeterReading'].max()-df['StartMeterReading'].min()

Run Code Online (Sandbox Code Playgroud)

但它填充了新的专栏NaN

我怎样才能达到我想要的结果。

原始数据框

+------+-------+--------------+------------+
| D_Id | T_Id  | StartReading | EndReading |
+------+-------+--------------+------------+
|    1 | 4716a |      4323.17 |     4324.8 |
|    1 | 4716a |      4324.96 |    4325.34 |
|    1 | 4716a |      4326.47 |    4327.22 |
|    1 | 4716a |       4327.4 |    4328.43 |
|    1 | 4716a |      4328.85 |    4330.73 |
|    1 | 4716b |      4346.65 |    4347.62 |
|    1 | 4716b |      4347.67 |    4349.88 | …

Run Code Online (Sandbox Code Playgroud)

python group-by dataframe pandas

M_S*_*S_N

lucky-day

2
推荐指数

1
解决办法

2913
查看次数