我有以下包含 3 列的 DataFrame a, b, c
。我将 DF 按 c 分组
dfByC = groupby(df, [:C])
Run Code Online (Sandbox Code Playgroud)
如何从dfByC
的某个值中选择一个组c
?
做:
dfByC[(the_value_you_have,)]
Run Code Online (Sandbox Code Playgroud)
或者
dfByC[(C=the_value_you_have,)]
Run Code Online (Sandbox Code Playgroud)
或者
dfByC[Dict(:C => the_value_you_have)]
Run Code Online (Sandbox Code Playgroud)
本质上 - 你可以通过传递 a Tuple
、 aNamedTuple
或字典来进行这样的选择。
不允许只写的原因dfByC[the_value_you_have]
是您还可以按GroupedDataFrame
整数索引,在其中获得连续的组,因此我们需要一些包装器来消除歧义。另外,如果您groupby
有多列,则需要一些包装器将它们保持在一起。
此外,通过对变量值进行分组来进行分组选择的速度很快(因此您可以安全地编写代码来执行数百万次此类查找,并且效率很高)。
归档时间: |
|
查看次数: |
813 次 |
最近记录: |