有没有办法将SPSS数据集导入Python,最好是NumPy重新格式?我环顾四周但找不到任何答案.
俊
这个问题的讨论是我提出这个问题的直接原因.更一般的原因是我经常需要向只熟悉SPSS的人解释R使用.我知道SPSS的大部分基础知识,因为我们仍然在基础课程统计中使用它.但由于我更像是一个R家伙,因此很难知道SPSS用户如何体验与R的第一次见面.
我知道有一本关于SAS和SPSS用户的书,它已经包含了一些信息.然而,我想知道当你从SPSS切换到R时,更困难的部分是什么.
或者换句话说:如果您需要在一天内向SPSS用户解释R,您会关注哪些主题?这是不是对了(是的,我知道,这不是因为一个得到报酬,它总是有道理...)一个假设性的问题.
我使用Likert量表问卷对产品进行了评估,并将日期输入SPSS.我的栏目排列如下:
ID,组,Q1,Q2,Q3,Q4
我有两个不同的小组填写问卷,每个人都有不同的数字ID.在Q列下,我得到了Likert量表中给出的那个人的分数(从1-5开始).
总共有超过300个回复.
我正在使用菜单栏中的"描述性统计/频率"运行分析,而不是获取我正在寻找的表格.基本上,它将所有受访者包括在一起,而我希望将表中的两个组进行比较.
如何使用SPSS按组分析问卷项目的描述性统计数据?
另外,如果您对SPSS中此类数据的分析有任何进一步的提示,我将非常感激.我想表明,各组之间的意见没有显着差异,从查看数据来看,似乎就是这种情况.
给出以下数据框:
structure(list(UH6401 = c(1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1,
1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0,
0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0,
1, 1, …Run Code Online (Sandbox Code Playgroud) 我最近从 SPSS 切换到 R 进行了一些数据分析。作为其中的一部分,我在 R 中运行了一些以前在 SPSS 中已经完成的分析,只是为了有一个很好的整洁的脚本。
在这种情况下,我的数据是 9 名参与者在孤立和受限的环境中对敌意情绪的自我评价。我对它们进行了五次测试(再次是夏季、秋季、冬季、春季、夏季)。数据是非正态分布的。
我在p=.012, ?2(4df)=12.79很久以前给我的 SPSS 中运行了弗里德曼测试 。我今天在 R 中重新运行了测试,它给了我这个:p=.951 (?2(4df)=.69). 这真的让我感到害怕,因为它让我有理由怀疑我迄今为止的所有分析。
一旦我发现了这一点,我将 SPSS 文件重新导出到.csv. 检查我是否不小心使用了不同的数据文件。绝对不是这样。
我使用了安迪菲尔德描述的弗里德曼测试:
Summer1 <- c(2,0,0,0,0,0,0,0,0)
Autumn <- c(3,0,1,0,0,4,2,0,1)
Winter <- c(1,0,0,0,0,2,5,1,1)
Spring <- c(1,0,2,2,2,8,4,0,1)
Summer2 <- c(3,0,2,1,0,4,7,1,1)
Hostility <- matrix(c(Summer1, Autumn, Winter, Spring, Summer2), nrow=9, byrow=TRUE)
friedman.test(Hostility)
Run Code Online (Sandbox Code Playgroud)
有没有人对此有解释,或者哪个结果是正确的?
我正在使用 Stata 进行数据分析,但必须通过将其保存为 .csv 文件来转换我使用的 SPSS 数据集(其中包括变量标签)。但是,在此过程中变量标签并未导出到 Stata。
我遵循了这个问题中的建议(In SPSS, is it possible to export a dataset file to .CSV with the value name代替 the value numeric?),但这仅指值标签,而不是变量标签。
如何导出 SPSS 变量标签?
我正在使用包 Haven 从 R 编写 SPSS .sav 文件,这通常对我来说效果很好。但是我注意到使用 write_sav() 在磁盘上写入的 .sav 文件大小似乎比必要的大得多。每当我在 SPSS 中打开并保存 write_sav() 写入的 .sav 文件时,文件大小都会减少约 10 倍!
这对我很重要,因为我正在为其他人向 SPSS 写入相当大的数据,有时 SPSS 拒绝打开一个非常大的文件。如果 write_sav() 以“真正的”原生 SPSS 方式更有效地存储,也许这不会出现问题?
有没有人知道这个问题,也许有一个有用的评论?需要安装 SPSS 才能复制此问题
关于如何读取或写入.sav文件,有几个问题和解答:
Excel相关的(例如,如何在excel中打开spss数据文件?)PHP相关的(例如,将数据导出到SPSS文件(* .sav))Python相关的(例如,在Python Django中导出到SPSS文件?)您知道该如何处理Node.js(带有或不带有本地插件)吗?如果您可以共享与相关资源的任何链接,我们将不胜感激。
我正在使用haven将.sav文件导入到R. 我想知道如何显示值标签而不是数字代码。在下面的示例中,我想显示物种名称而不是数字 1、2、3。
library(haven)\npath <- system.file("examples", "iris.sav", package = "haven")\ndf1 <- read_sav(path)\nhead(df1)\n\n# A tibble: 6 x 5\nSepal.Length Sepal.Width Petal.Length Petal.Width Species \n<dbl> <dbl> <dbl> <dbl> <dbl+lbl>\n1 5.10 3.50 1.40 0.200 1 \n2 4.90 3.00 1.40 0.200 1 \n3 4.70 3.20 1.30 0.200 1 \n4 4.60 3.10 1.50 0.200 1 \n5 5.00 3.60 1.40 0.200 1 \n6 5.40 3.90 1.70 0.400 1 \n\nstr(df1)\nClasses \xe2\x80\x98tbl_df\xe2\x80\x99, \xe2\x80\x98tbl\xe2\x80\x99 and \'data.frame\': 150 obs. of 5 variables:\n $ Sepal.Length: …Run Code Online (Sandbox Code Playgroud) 我必须读取 sav 文件\n我使用该包haven
library(haven)\ndataset<- read_sav("datafile.sav")\nRun Code Online (Sandbox Code Playgroud)\n在控制台中我可以看到标签:
\n\n dput(head(voyages$portdep))\n structure(c(50422, 50299, 50299, 50299, NA, NA), label = "Port of departure", labels = c(Alicante = 10101, \n Barcelona = 10102, Bilbao = 10103, Cadiz = 10104, Figuera = 10105, \n Gibraltar = 10106, `La Coru\xc3\xb1a` = 10107, Santander = 10110, Seville = 10111, \n `San Lucar` = 10112, Vigo = 10113, `Spain, port unspecified` = 10199, \n Lagos = 10202, Lisbon = 10203, Oporto = 10204, `Ilho do …Run Code Online (Sandbox Code Playgroud)