小编Rou*_*use的帖子

在R中并行执行glmnet

我的训练数据集有大约200,000条记录,我有500个功能.(这些是来自零售组织的销售数据).大多数功能都是0/1,并存储为稀疏矩阵.

目标是预测约200种产品的购买概率.因此,我需要使用相同的500个功能来预测200种产品的购买概率.由于glmnet是模型创建的自然选择,我想到了为200个产品并行实现glmnet.(因为所有200个型号都是独立的)但是我被困在使用foreach.我执行的代码是:

foreach(i = 1:ncol(target)) %dopar%
{
assign(model[i],cv.glmnet(x,target[,i],family="binomial",alpha=0,type.measure="auc",grouped=FALSE,standardize=FALSE,parallel=TRUE))
}
Run Code Online (Sandbox Code Playgroud)

model是一个列表 - 包含200个模型名称的列表,我想在其中存储各自的模型.

以下代码有效.但它没有利用并行结构,需要大约一天才能完成!

for(i in 1:ncol(target))
{ assign(model[i],cv.glmnet(x,target[,i],family="binomial",alpha=0,type.measure="auc",grouped=FALSE,standardize=FALSE,parallel=TRUE))
}
Run Code Online (Sandbox Code Playgroud)

在这种情况下,有人能指出如何利用并行结构吗?

parallel-processing foreach r glmnet

12
推荐指数
2
解决办法
7511
查看次数

anaconda ipython笔记本未在服务器设置中启动

我正在尝试在Terminal.com上安装Anaconda。我按照网站上列出的说明进行操作:https : //gist.github.com/iamatypeofwalrus/5183133

安装成功。我可以在终端上输入ipython来登录python。但是当我输入$ ipython notebook

我在终端上收到以下错误消息

[I 10:35:24.760 NotebookApp] Using existing profile dir: u'/root/.ipython/profile_default'
[I 10:35:24.872 NotebookApp] Using MathJax from CDN: https://cdn.mathjax.org/mathjax/latest
/MathJax.js
[I 10:35:24.891 NotebookApp] The port 8888 is already in use, trying another random port.
Traceback (most recent call last):
  File "/root/anaconda/bin/ipython", line 6, in <module>
    sys.exit(start_ipython())
  File "/opt/ipython/IPython/__init__.py", line 120, in start_ipython
    return launch_new_instance(argv=argv, **kwargs)
  File "/opt/ipython/IPython/config/application.py", line 548, in launch_instance
    app.initialize(argv)
  File "<string>", line 2, in initialize
  File "/opt/ipython/IPython/config/application.py", line 74, in catch_config_error
    return …
Run Code Online (Sandbox Code Playgroud)

ipython ipython-notebook anaconda

4
推荐指数
2
解决办法
6228
查看次数