小编Muh*_*han的帖子

按时间分组,然后仅当列表中存在唯一条目时才对唯一条目进行计数

考虑以下熊猫数据帧“ df”和python列表“ my_list”。

df =

timestamp  address    type
1           1          A
2           9          B
3           3          A
4           6          B
5           6          B
6           2          B
7           3          A
8           2          B
9           1          B
10          3          A
11          3          A
12          3          A
Run Code Online (Sandbox Code Playgroud)

my_list =

[1, 2, 3]
Run Code Online (Sandbox Code Playgroud)

现在,我想要的是将时间戳帧中的数据帧分组在3秒的容器中,并且仅当“ my_list”中存在地址时才对唯一的“类型”进行计数。

预期的输出应如下所示:

timestamp   A    B    
1           2    0 #One "B" ignored, because address=9 is not in my_list
4           0    1 #Two "B" ignored because address is not in "my_list
7 …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

2
推荐指数
1
解决办法
126
查看次数

如果数据框中不存在列,则返回空列[Panda]

我创建了一个数据帧df,如下所示:

Type = ['A', 'B', 'C', 'D']
Size = [72,23,66,12]
df = pd.DataFrame({'Type': Type, 'Size': Size})
Run Code Online (Sandbox Code Playgroud)

我可以使用以下方法提取任何现有列

df_count = df['Size']
Run Code Online (Sandbox Code Playgroud)

但是,如果数据框太大,我不知道列是否存在于df中.如果我调用一个列,例如df ['Shape'],如下所示:

df_null = df['Shape']
Run Code Online (Sandbox Code Playgroud)

它返回"关键错误".但是我希望df_null应该得到一个名为"Shape"的空列.

python dataframe pandas

1
推荐指数
1
解决办法
2305
查看次数

标签 统计

dataframe ×2

pandas ×2

python ×2