R - 将 R 模型序列化为 JSON

Jov*_*SFT 5 serialization json r jsonlite

是否有一些好的 R 包可以将预测模型和其他复杂对象与 JSON 相互转换?我从这个例子中得到了线性回归模型:

eruption.lm = lm(eruptions ~ waiting, data=faithful) 
newdata = data.frame(waiting=80)
predict(eruption.lm, newdata) 
Run Code Online (Sandbox Code Playgroud)

我想将 eruption.lm 模型序列化为 JSON 将其存储在某处或将其发送到某个外部系统,然后对其进行反序列化并进行预测。我尝试过使用jsonlite R 包

json<-serializeJSON(eruption.lm)
lin.model<-unserializeJSON(json)

predict(lin.model, newdata)
Run Code Online (Sandbox Code Playgroud)

但是,jsonlite 无法处理复杂的对象——反序列化​​模型在预测中返回错误:

Error in eval(expr, envir, enclos) : could not find function "list"
Run Code Online (Sandbox Code Playgroud)

是否有一些更好的包可以序列化/反序列化对象。

hrb*_*str 3

您只需要帮助它记住以下环境terms

attr(lin.model$terms, ".Environment") <- .GlobalEnv

predict(lin.model, newdata)

##       1 
## 4.17622 
Run Code Online (Sandbox Code Playgroud)

我会将其作为增强请求提交到http://github.com/jeroenooms/jsonlite/issues

或者,您可以使用本机 R 二进制序列化:

saveRDS(lin.model, "lin.model.rds")

predict(readRDS("lin.model.rds"), newdata)

##       1 
## 4.17622 
Run Code Online (Sandbox Code Playgroud)

除非你绝对需要文本序列化方法,在这种情况下你可以这样做:

saveRDS(lin.model, file="lin.model.txt", ascii=TRUE)

predict(readRDS("lin.model.txt"), newdata)

##       1 
## 4.17622 
Run Code Online (Sandbox Code Playgroud)

ascii=TRUE生成对象的文本十六进制表示:

1f8b 0800 0000 0000 0003 ed5d c992 1cb9
91bd e797 cc1c 9806 381c db51 36a6 c35c
e61f 4a64 5153 3645 b255 2cb6 749a 6f1f
5fb0 bcc8 ca62 4b1a 33f5 25da 8c6d 8848
04fc f9f6 b004 10f5 870b 5d62 afa9 964b
4cb1 71b8 d456 2f91 2e99 8afc f421 5e5b
e510 73ef 9770 0d35 17aa 3d5f 6290 5fe3
850a c59c 2ef9 f2f5 e1cb e3f7 4bd4 27c6
bd18 2fff f69f 5f5f 1f5f 3e3e fef2 faef
f36e bdfc f5e1 e9f5 e9eb 9f2f 94d9 4554
1112 ae39 84dc 63d7 2287 de7a b2bb a975
... (lots more)
Run Code Online (Sandbox Code Playgroud)

可以存储在二进制 blob 无法存储的位置。

如果您需要一种可读的文本序列化方法,那么提交上述建议的增强请求可能是正确的选择。