我想使用线性回归模型,但我想使用普通最小二乘法,我认为它是一种线性回归.我使用的软件是SPSS.它只有线性回归,偏最小二乘和2阶最小二乘.我不知道哪一个是普通的最小二乘(OLS).
作为R用户,我现在正在尝试学习SPSS语法。
我s rm(list=ls())在R脚本的存在处添加命令,以确保在我继续工作之前R为空。
SPSS是否有类似的命令?谢谢。
我在SPSS工作并有大量变量,称之为v1到v7000.
我想对每个变量执行一系列"复杂操作"以创建一组新的变量:t1到t7000.
为了便于说明,我们只说"复杂操作"是将t1设为v1的平方,t2为v2的平方等.
我的想法是写一些这样的代码.
do repeat t=t1 to t7000
compute t = v*v;
end repeat.
Run Code Online (Sandbox Code Playgroud)
但是,我不认为这会奏效.
这样做的正确方法是什么?非常感谢提前.
我发现混合结果谷歌搜索.我需要解析SPSS .sav文件以发现数据布局并提取调查结果.第一步是阅读数据的"模式".例如,我需要知道问题及其允许的响应类型.我打算在我自己的SQL表中对这些数据进行建模,这样我就可以根据我的应用程序要求对其进行切片和切块.第二步是使用受访者答案填充我的数据模型.查看SPSS sav文件,我相信它有我正在寻找的两种类型的数据.
如果我不严格要求,我不需要或不需要昂贵的SPSS软件.我们不会对这些数据进行统计,只根据答案过滤器选择受访者的子集.SPSS文件将由许可SPSS的合作伙伴公司提供.我不需要将任何数据反馈回SPSS; 我的用例是只读的.
我可以使用Python,带或不带Groovy的Java,C/C++作为我的解析器程序.该程序将在数据收集结束时运行一次,因此性能不是特别重要.理想情况下,我希望我的代码是跨平台的,所以我可以在我的Mac上进行开发并部署到Linux,但如果必须,我可以使用Windows
我发现的很多东西要么是2004年的java类,要么是需要IBM的DLL并且是特定于Windows的现代Python代码.基于我对需求的快速解释,我将非常感谢SO社区的建议.我认为我的需求很简单,但还没有找到我所希望的.开源库是理想的,但我甚至会以合理的价格购买简单的商业解决方案.
在R中,有一个source函数可以从另一个R脚本中获取R脚本.我希望能够在SPSS中做同样的事情.
如何从另一个SPSS语法文件中获取SPSS语法文件?
我想将MASS包中的数据集导出到SPSS以进行进一步调查.我正在寻找包中的EuStockMarkets数据集.
如http://www.statmethods.net/input/exportingdata.html中所述,我做了:
library(foreign)
write.foreign(EuStockMarkets, "c:/mydata.txt", "c:/mydata.sps", package="SPSS")
Run Code Online (Sandbox Code Playgroud)
我有一个文本文件,但sps文件不是有效的SPSS文件.我真的在寻找一种方法将数据集导出到SPSS可以打开的东西.
我有一堆SPSS数据和语法文件,它们每天都在移动,每天都在更改文件夹。但是,相对路径保持不变。有没有办法利用这个事实?例如:使用INCLUDE命令并引用一个语法文件,该文件始终是一个路径级别;或使用GET打开文件(位于两个级别上)
在谷歌搜索中,我发现了对HOST命令的一些引用,但是我并没有使它起作用。
任何输入将不胜感激:)
提前谢谢
有一个foreign具有write.foreign()可以写入SPS和CSV文件的功能的程序包。这样,SPS文件就可以将CSV文件读入包含标签的SPSS中。到目前为止,还可以,但是该功能存在一些问题:
DATA LISTattr(),则这些标签将丢失。write.foreign()如果任何变量中的数目超过255 ,该函数也会停止。...这样的错误消息:
Error in if (any(lengths > 255L)) stop("Cannot handle character variables longer than 255") :
missing value where TRUE/FALSE needed
Run Code Online (Sandbox Code Playgroud)
我花了很多时间,然后找到了一个不错的帖子(http://r.789695.n4.nabble.com/SPSS-export-in-R-package-foreign-td921491.html),可以开始制作更好。这是我的结果,我想与您分享。
我有以下内容dataframe:
import pandas as pd
mc_all = pd.DataFrame({'col_1': [0,1,1,2],
'col_2' : ['france','france','uk','uk']})
Run Code Online (Sandbox Code Playgroud)
我正在尝试此操作以便将其保存到文件dataframe中sav
args = ( list(mc_all.columns), dict(zip(list(mc_all.columns),[0]*len(list(mc_all.columns)))) )
with SavWriter('mc_all.sav',*args) as writer:
writer.writerows(mc_all)
Run Code Online (Sandbox Code Playgroud)
根据这个,但它不起作用。它抛出一个错误:
error.SPSSIOError:提交标头时出现问题 [SPSS_INVALID_HANDLE]
有任何想法吗 ?