标签: spss-modeler

如何在添加多个列的“扩展转换(R 语法)”节点中正确制作“modelerData”和“modelerDataModel”

我使用 SPSS 建模器 v18.2.1 和 R v3.5.1(或 v3.3.3)使用 Essentials for R 18.2.1

我正在尝试制作“扩展转换(R 语法)”节点来处理 SPSS 难以处理的一些问题(未来:使它们成为扩展包)。我希望他们添加多个列,创建新数据等并给出下一个节点data.frame。但是data.frameSPSS 节点错误地识别了它们(即,下一个表节点的输出与 的控制台输出不同print(modelerData))。
怎么做 ?(或者这是一个错误?)

任何帮助将不胜感激。下面是一个可重现的简单示例;

[准备R env和数据(请用纯R做)]

# if not installed 
install.packages(randomForest)

set.seed(1)  # to reproduce
write.csv(iris[sort(sample(1:150, 100)), ], "iris_train_seed1.csv", row.names = FALSE)
Run Code Online (Sandbox Code Playgroud)

【我的节点流程】
在此处输入图片说明

【扩展变换的R代码】

### library ###
library(randomForest)

# make_model
set.seed(1)
modelerModel <- randomForest(formula = Species ~ . ,
                             data = modelerData,
                             ntree = 100)

#### predict
pred_forest <- data.frame(pred = predict(modelerModel, 
                                         newdata = modelerData))
prob_forest …
Run Code Online (Sandbox Code Playgroud)

r spss-modeler

6
推荐指数
1
解决办法
252
查看次数

IBM spss Modeler,如何删除包含缺失值的行

我的所有数据都在.txt文件中,字段分隔符是逗号和换行符.所以我使用"Var.File"组件作为Source组件.

我试图弄清楚如何删除包含空值的行,然后获取输出以进行进一步处理.

spss spss-modeler

5
推荐指数
1
解决办法
4260
查看次数

SPSS Modeler中的Pandas模块

我需要将使用Python 3开发的某些代码放入SPSS Modeler节点(使用Extension Transform节点)。这段代码使用了pandas,默认安装的Modeler不包含此模块。

我试图通过按照以下说明修改“ options.cfg”文件,使SPSS指向我自己的Python安装(包括pandas模块):

https://www.ibm.com/support/knowledgecenter/zh-CN/SS3RA7_sub/modeler_r_nodes_ddita/clementine/r_pyspark_api.html

但是,当我尝试在SPSS Modeler中导入熊猫时,它无法加载模块。实际上,我无法通过以下方式加载pyspark:

import spss.pyspark

另外,当我尝试查看python可执行文件的目录时:

import sys print sys.executable

SPSS会返回“无”值。

如何在SPSS Modeler中使用熊猫?看来我无法在Modeler中导入任何模块。我是SPSS的初学者,因此对您有所帮助。

python pandas pyspark spss-modeler

5
推荐指数
1
解决办法
787
查看次数

标签 统计

spss-modeler ×3

pandas ×1

pyspark ×1

python ×1

r ×1

spss ×1