我使用 SPSS 建模器 v18.2.1 和 R v3.5.1(或 v3.3.3)使用 Essentials for R 18.2.1。
我正在尝试制作“扩展转换(R 语法)”节点来处理 SPSS 难以处理的一些问题(未来:使它们成为扩展包)。我希望他们添加多个列,创建新数据等并给出下一个节点data.frame。但是data.frameSPSS 节点错误地识别了它们(即,下一个表节点的输出与 的控制台输出不同print(modelerData))。
怎么做 ?(或者这是一个错误?)
任何帮助将不胜感激。下面是一个可重现的简单示例;
[准备R env和数据(请用纯R做)]
# if not installed
install.packages(randomForest)
set.seed(1) # to reproduce
write.csv(iris[sort(sample(1:150, 100)), ], "iris_train_seed1.csv", row.names = FALSE)
Run Code Online (Sandbox Code Playgroud)
【扩展变换的R代码】
### library ###
library(randomForest)
# make_model
set.seed(1)
modelerModel <- randomForest(formula = Species ~ . ,
data = modelerData,
ntree = 100)
#### predict
pred_forest <- data.frame(pred = predict(modelerModel,
newdata = modelerData))
prob_forest …Run Code Online (Sandbox Code Playgroud) 我的所有数据都在.txt文件中,字段分隔符是逗号和换行符.所以我使用"Var.File"组件作为Source组件.
我试图弄清楚如何删除包含空值的行,然后获取输出以进行进一步处理.
我需要将使用Python 3开发的某些代码放入SPSS Modeler节点(使用Extension Transform节点)。这段代码使用了pandas,默认安装的Modeler不包含此模块。
我试图通过按照以下说明修改“ options.cfg”文件,使SPSS指向我自己的Python安装(包括pandas模块):
但是,当我尝试在SPSS Modeler中导入熊猫时,它无法加载模块。实际上,我无法通过以下方式加载pyspark:
import spss.pyspark
另外,当我尝试查看python可执行文件的目录时:
import sys
print sys.executable
SPSS会返回“无”值。
如何在SPSS Modeler中使用熊猫?看来我无法在Modeler中导入任何模块。我是SPSS的初学者,因此对您有所帮助。