小编Pri*_*kar的帖子

在R glm模型中选择统计上显着的变量

我有一个结果变量,比如说Y和100个可能影响Y的维度列表(比如X1 ... X100).

运行我的glm并查看我的模型摘要后,我看到那些具有统计意义的变量.我希望能够选择这些变量并运行另一个模型并比较性能.有没有办法可以解析模型摘要并只选择那些重要的?

r glm

12
推荐指数
2
解决办法
2万
查看次数

数据表操作链接

执行以下类型操作的最佳方法是什么:

假设我想找出 user_id <0 的所有行的索引,或者甚至说找到平均销售额 >50 的 user_id。

我首先使用索引生成数据表,然后使用本质上是另一个 data.table 的内容进行过滤。有没有更有效的方法?

在这个例子中,我想要索引 2,即 user_id <0 的行的索引

x<-data.table(user_id=c(1,-1,2,3),iqlevel=c(40,50,60,70))
x[,I:=.I,][user_id<0,I,]
Run Code Online (Sandbox Code Playgroud)

r data.table

5
推荐指数
1
解决办法
1138
查看次数

Python的.group()只返回第一个匹配

我运行了以下代码,只得到第一个')'作为匹配.有人可以帮我解释为什么常规的贪婪'))'没有被退回?

r=re.compile('\)')
var=r.search('- hi- ))there')
print var.group()
Run Code Online (Sandbox Code Playgroud)

python regex

1
推荐指数
2
解决办法
4791
查看次数

标签 统计

r ×2

data.table ×1

glm ×1

python ×1

regex ×1