小编lur*_*rig的帖子

我正在尝试编写一个并行化的 for 循环，在其中我试图以最佳方式找到最佳 GLM 以仅对具有最低 p 值的变量进行建模，以查看我是否要打网球（是/否，二进制） .

例如，我有一个包含气象数据集的表（及其数据框）。我首先通过查看这些模型中的哪一个 p 值最低来构建 GLM 模型

PlayTennis ~ Precip
PlayTennis ~ Temp, 
PlayTennis ~ Relative_Humidity
PlayTennis ~ WindSpeed)

假设PlayTennis ~ Precip具有最低的 p 值。因此，repeat 中的下一个循环迭代是查看哪些其他变量将具有最低的 p 值。

PlayTennis ~ Precip + Temp
PlayTennis ~ Precip + Relative_Humidity 
PlayTennis ~ Precip + WindSpeed

这将一直持续到没有更显着的变量（P 值大于 0.05）。因此我们得到了PlayTennis ~ Precip + WindSpeed（这都是假设的）的最终输出。

是否有关于如何在各种内核上并行化此代码的建议？我遇到了一个speedglm从库 speedglm调用的 glm 的新函数。这确实有所改善，但并没有太大改善。我还研究了foreach循环，但我不确定它如何与每个线程通信以了解各个运行的 p 值是更大还是更低。预先感谢您的任何帮助。

d =

Time          Precip    Temp    Relative_Humidity   WindSpeed   …   PlayTennis    
1/1/2000 0:00 …

5
推荐指数

0
解决办法

478
查看次数

glm ×1

r ×1

小编lur_rig的帖子