我有一个包含这样的数据集:
case,group,val1,val2,val3,val4
1,1,3,5,6,8
2,1,2,7,5,4
3,2,1,3,6,8
4,2,5,4,3,7
5,1,8,6,5,3
Run Code Online (Sandbox Code Playgroud)
我试图以编程方式计算组中值向量之间的欧几里德距离.
这意味着我在n个组中有x个案例.在成对的行之间计算欧氏距离,然后对该组进行平均.因此,在上面的例子中,首先我计算组1的平均值和标准差(情况1,2和5),然后标准化值(即[(原始值 - 平均值)/ st dev],然后计算案例之间的ED 1和案例2,案例2和5,以及案例1和5,最后平均该组的ED.
任何人都可以建议以一种合理有效的方式实现这一目标吗?
我希望能够准确地解释这一点.
我有12个二分变量(是/否)我想要计算一个新变量,其中包括对这12个变量中的3个或更多个回答"是"的人.
这些天我的编程有点软,所以很难构建一个语句(在GUI中 - 而不是语法).
任何人都可以提供一些帮助/指导我如何实现这一目标?
非常感谢你.
我是一个试图切换到R 的SPSS用户.
我在数据框中有几个变量(ea01to ea06; pre01to pre09).
数据来自调查问卷,采用Likert格式(1到5之间的整数).
SPSS可以选择验证这些变量的值,以检查它们是否都在预期范围内,并显示其中包含无效错误.
id ea01 ea02 ea03 ea04
1 4 5 6 5
2 3 2 1 3
3 3 2 4 0
4 5 3 4 3
Run Code Online (Sandbox Code Playgroud)
验证程序应该告诉我案例1作为变量中的无效值和变量中的ea03案例3 ea04.
如何在R中完成?
嘿,我正在尝试计算统计量中的余弦分析,但我不知道如何这样做.我需要计算节奏数据的MESOR,AMPLITUDE和ACROPHASE.
有一个链接,显示如何做,公式等,但它没有给我很多帮助.有没有人知道它的代码,无论是在statistica还是SPSS?
我真的需要这样做,因为它是一篇重要的论文
我需要在Python(Django)中将数据导出为SPSS文件格式,但我无法在谷歌中找到util信息.
有办法做到这一点吗?有人尝试过吗?
提前致谢!
我需要修改它时,有一个非常大的(5000行)语法文件和SPSS 19扼流圈。因此,我想将文件拆分为多个子文件。但是该怎么做呢?简单地拆分它们是有风险的,因为我必须记住要运行每个文件。是否可以链接多个语法文件,以便我可以运行调用BCDE的文件A?我已经阅读过有关“ include”的信息,但是有人提到它不能应付Identation?
谢谢
我想编写一个与SPSS命令AUTORECODE相同的函数.
AUTORECODE将字符串和数字变量的值重新编码为连续的整数,并将重新编码的值放入称为目标变量的新变量中.
起初我尝试过这种方式:
AUTORECODE <- function(variable = NULL){
A <- sort(unique(variable))
B <- seq(1:length(unique(variable)))
REC <- Recode(var = variable, recodes = "A = B")
return(REC)
}
Run Code Online (Sandbox Code Playgroud)
但这会导致错误.我认为问题是由A和B提交给recodes参数引起的.这就是我尝试的原因
eval(parse(text = paste("REC <- Recode(var = variable, recodes = 'c(",A,") = c(",B,")')")))
Run Code Online (Sandbox Code Playgroud)
在功能内.但这不是正确的解决方案.
想法?
我试图找到一种在Excel中将yes/no转换为1/0的有效方法.因为我在SPSS进行数据分析.或者如果在SPSS中直接将YES/NO转换为1/0的方式?
这是我第一次使用 Jupyter Notebook 分析调查数据(.sav 文件),我希望以显示元数据的方式阅读它,以便我可以将答案与问题联系起来。我是这个领域的新手,所以非常感谢您的帮助!
import pandas as pd
import pyreadstat
df, meta = pyreadstat.read_sav('./SimData/survey_1.sav')
type(df)
type(meta)
df.head()
Run Code Online (Sandbox Code Playgroud)
如果我需要执行额外的步骤才能看到元数据,请告诉我!
我尝试使用该read_SPSS命令,但没有成功。该错误似乎告诉我我需要pyreadstat,但我什至无法安装它。但为什么我需要pyreadstat?.sav现在的熊猫不是已经具备了阅读能力了吗?我很困惑...
这是我尝试使用时收到的错误文本read_SPSS:
ImportError Traceback (most recent call last)
<ipython-input-33-935d54be8b7a> in <module>
----> 1 twitter=pd.read_spss('twitter_study.sav')
/opt/anaconda3/lib/python3.8/site-packages/pandas/io/spss.py in read_spss(path, usecols, convert_categoricals)
34 DataFrame
35 """
---> 36 pyreadstat = import_optional_dependency("pyreadstat")
37
38 if usecols is not None:
/opt/anaconda3/lib/python3.8/site-packages/pandas/compat/_optional.py in import_optional_dependency(name, extra, raise_on_missing, on_version)
108 except ImportError:
109 if raise_on_missing:
--> 110 raise ImportError(msg) from None
111 else:
112 return None
ImportError: Missing optional dependency 'pyreadstat'. Use pip or conda to install pyreadstat.
Run Code Online (Sandbox Code Playgroud) spss ×10
python ×3
r ×3
excel ×2
pandas ×2
analysis ×1
converter ×1
django ×1
metadata ×1
statistics ×1
syntax ×1
time-series ×1
trigonometry ×1
vba ×1