df:
id c1 c2 c3
101 a b c
102 b c d
103 d e f
101 h i j
102 k l m
Run Code Online (Sandbox Code Playgroud)
我想根据对id列进行分组来选择行count > 1
结果应该是所有id条目超过1个的行
预期结果:
df:
id c1 c2 c3
101 a b c
102 b c d
101 h i j
102 k l m
Run Code Online (Sandbox Code Playgroud)
我可以使用下面编写的代码实现这一目标。
g = df.groupby('id').size().reset_index(name='counts')
filt = g.query('counts > 1')
m_filt = df.id.isin (filt.id)
df_filtered= df[m_filt]
Run Code Online (Sandbox Code Playgroud)
想检查是否有更好的方法。
我正在使用插入符包来训练我的模型。
我的模型工作正常。但是当我绘制决策树时,标签是空白的。我如何获得标签?
carMod <- train( FLAG ~.,data=df_train, method="rpart" )
plot(carMod$finalModel)
Run Code Online (Sandbox Code Playgroud)