为什么连接正在终止

rks*_*rks 6 memory r out-of-memory random-forest h2o

我正在尝试一个随机森林分类模型,H2O在R中使用具有7000万行和25个数字特征的训练集内的库.总文件大小为5.6 GB.

验证文件的大小为1 GB.

我的系统上有16 GB RAM和8核CPU.

系统成功读取H2O对象中的两个文件.

然后我给出以下命令来构建模型:

model <- h2o.randomForest(x = c(1:18,20:25), y = 19, training_frame = traindata, 
                          validation_frame = testdata, ntrees = 150, mtries = 6)
Run Code Online (Sandbox Code Playgroud)

但几分钟后(没有生成任何树),我得到以下错误:

".h2o.doSafeREST中的错误(conn = conn,h2oRestApiVersion = h2oRestApiVersion,:意外的CURL错误:Recv失败:通过对等方重置连接"

但是,如果我尝试上面的代码与1树,它运行成功.

上述错误是否因内存问题而发生?任何帮助将不胜感激.

Kin*_*ngz 5

它是一个 OutOfMemoryError。R 端此错误消息的一个变体是:

Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion,  : 
  Unexpected CURL error: Empty reply from server
Run Code Online (Sandbox Code Playgroud)

检查 h2o 服务器日志(您也应该这样做)会告诉您:

10-08 20:11:57.165 192.168.0.4:54321     2125   #58072-18 INFO: Total file size: 1.81 GB
10-08 20:11:57.165 192.168.0.4:54321     2125   #58072-18 INFO: Parse chunk size 4194304
        onExCompletion for water.parser.ParseDataset$MultiFileParseTask@3588360e
        java.lang.OutOfMemoryError: Java heap space
:
:
Exception in thread "FJ-0-11" java.lang.OutOfMemoryError: Java heap space
2015-10-08 20:13:14.493:WARN:oejut.QueuedThreadPool:1 threads could not be stopped
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-5    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.458 192.168.0.4:54321     2125   FJ-0-3    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-13   ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-7    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:26.541 192.168.0.4:54321     2125   FJ-0-5    FATAL: Exiting.
10-08 20:13:26.574 192.168.0.4:54321     2125   FJ-0-7    FATAL: Exiting.
10-08 20:13:26.575 192.168.0.4:54321     2125   FJ-0-3    FATAL: Exiting.
10-08 20:13:26.575 192.168.0.4:54321     2125   FJ-0-13   FATAL: Exiting.
Run Code Online (Sandbox Code Playgroud)

我在 h2o Slater (3.2.0.5) 上运行它,所以根据你的版本,这可能会有所不同。


cyb*_*j0g 4

可能是你记性不好了。尝试查看森林生长期间系统的内存使用情况。还可以尝试直接从 H2O Web 控制台(默认为http://localhost:54321/)启动训练,可能会给出更详细的错误。