我有一个结果变量,比如说Y和100个可能影响Y的维度列表(比如X1 ... X100).
运行我的glm并查看我的模型摘要后,我看到那些具有统计意义的变量.我希望能够选择这些变量并运行另一个模型并比较性能.有没有办法可以解析模型摘要并只选择那些重要的?
执行以下类型操作的最佳方法是什么:
假设我想找出 user_id <0 的所有行的索引,或者甚至说找到平均销售额 >50 的 user_id。
我首先使用索引生成数据表,然后使用本质上是另一个 data.table 的内容进行过滤。有没有更有效的方法?
在这个例子中,我想要索引 2,即 user_id <0 的行的索引
x<-data.table(user_id=c(1,-1,2,3),iqlevel=c(40,50,60,70))
x[,I:=.I,][user_id<0,I,]
Run Code Online (Sandbox Code Playgroud) 我运行了以下代码,只得到第一个')'作为匹配.有人可以帮我解释为什么常规的贪婪'))'没有被退回?
r=re.compile('\)')
var=r.search('- hi- ))there')
print var.group()
Run Code Online (Sandbox Code Playgroud)