SPSS Modeler中的Pandas模块

Pac*_*men 5 python pandas pyspark spss-modeler

我需要将使用Python 3开发的某些代码放入SPSS Modeler节点(使用Extension Transform节点)。这段代码使用了pandas,默认安装的Modeler不包含此模块。

我试图通过按照以下说明修改“ options.cfg”文件,使SPSS指向我自己的Python安装(包括pandas模块):

https://www.ibm.com/support/knowledgecenter/zh-CN/SS3RA7_sub/modeler_r_nodes_ddita/clementine/r_pyspark_api.html

但是,当我尝试在SPSS Modeler中导入熊猫时,它无法加载模块。实际上,我无法通过以下方式加载pyspark:

import spss.pyspark

另外,当我尝试查看python可执行文件的目录时:

import sys print sys.executable

SPSS会返回“无”值。

如何在SPSS Modeler中使用熊猫?看来我无法在Modeler中导入任何模块。我是SPSS的初学者,因此对您有所帮助。

小智 4

您可以通过转至安装路径(例如“C:\Program Files\IBM\SPSS\Modeler\18.1”)然后进入文件夹 python 将新软件包安装到现有 SPSS Modeler 18.1 版本。您可以在管理模式下打开 Windows 命令 shell。现在输入

python.exe -m pip 安装 pandas

它将安装供 SPSS 使用的库。