考虑以下熊猫数据帧“ df”和python列表“ my_list”。
df =
timestamp address type
1 1 A
2 9 B
3 3 A
4 6 B
5 6 B
6 2 B
7 3 A
8 2 B
9 1 B
10 3 A
11 3 A
12 3 A
Run Code Online (Sandbox Code Playgroud)
my_list =
[1, 2, 3]
Run Code Online (Sandbox Code Playgroud)
现在,我想要的是将时间戳帧中的数据帧分组在3秒的容器中,并且仅当“ my_list”中存在地址时才对唯一的“类型”进行计数。
预期的输出应如下所示:
timestamp A B
1 2 0 #One "B" ignored, because address=9 is not in my_list
4 0 1 #Two "B" ignored because address is not in "my_list
7 …Run Code Online (Sandbox Code Playgroud) 我创建了一个数据帧df,如下所示:
Type = ['A', 'B', 'C', 'D']
Size = [72,23,66,12]
df = pd.DataFrame({'Type': Type, 'Size': Size})
Run Code Online (Sandbox Code Playgroud)
我可以使用以下方法提取任何现有列
df_count = df['Size']
Run Code Online (Sandbox Code Playgroud)
但是,如果数据框太大,我不知道列是否存在于df中.如果我调用一个列,例如df ['Shape'],如下所示:
df_null = df['Shape']
Run Code Online (Sandbox Code Playgroud)
它返回"关键错误".但是我希望df_null应该得到一个名为"Shape"的空列.