我想选择满足多行多个条件的数据帧的子集.我知道我可以按顺序 - 首先选择匹配第一个条件的子集,然后选择匹配第二个条件的那个,等等,但似乎它应该能够在一个步骤中完成.以下似乎应该有效,但没有.显然它在其他语言的DataFrame实现中确实如此.有什么想法吗?
using DataFrames
df = DataFrame()
df[:A]=[ 1, 3, 4, 7, 9]
df[:B]=[ "a", "c", "c", "D", "c"]
df[(df[:A].<5)&&(df[:B].=="c"),:]
type: non-boolean (DataArray{Bool,1}) used in boolean context
while loading In[18], in expression starting on line 5
Run Code Online (Sandbox Code Playgroud)
这是一个朱莉娅的事情,而不是一个DataFrame的事情:你想要&而不是&&.例如:
julia> [true, true] && [false, true]
ERROR: TypeError: non-boolean (Array{Bool,1}) used in boolean context
julia> [true, true] & [false, true]
2-element Array{Bool,1}:
false
true
julia> df[(df[:A].<5)&(df[:B].=="c"),:]
2x2 DataFrames.DataFrame
| Row | A | B |
|-----|---|-----|
| 1 | 3 | "c" |
| 2 | 4 | "c" |
Run Code Online (Sandbox Code Playgroud)
FWIW,这在Python中的pandas中的工作方式相同:
>>> df[(df.A < 5) & (df.B == "c")]
A B
1 3 c
2 4 c
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
8598 次 |
| 最近记录: |