我已经找了这么长时间,并且无法弄清楚如何使用我拥有的csv文件在R中运行Principal Component Analysis.我继续得到这个错误:
Error in cov.wt(z) : 'x' must contain finite values only
到目前为止我所拥有的只是
data <- read.csv("2014 07 24 Pct Chg Variables.csv")
pca <- princomp(data3, cor=T)
Error in cov.wt(z) : 'x' must contain finite values only
Run Code Online (Sandbox Code Playgroud)
我有一些""在我的csv文件中,并尝试过
data2 <- apply(data, 1, f1)
data3 <- as.numeric(data2)
Run Code Online (Sandbox Code Playgroud)
where f1是一个函数,用于应用值为空白的均值.
我想在R中使用中介分析来分析实验中的数据.然而,实验设计是跨三个变量的全因子设计(两个连续,一个分类),我找不到如何在R中实现多个调解的解释治疗.我已经阅读了mediation包装上的文档,但它们似乎没有提供X超越单一处理的扩展方法.同样,我无法找到一种方法来做MBESS或lavaan打包.
我发现了一篇最近的文章,讨论了在调解分析中实施多种处理所需的统计理论/方法,Hayes和Preacher 2014(http://quantpsy.org/pubs/hayes_preacher_2014.pdf),但不幸的是,他们只给出了代码实现他们在Mplus,SPSS和SAS方面的方法.我需要在接下来的几天内实现这个以便进行演示,所以我没时间赶上另一个程序来完成它,我需要在R中实现它.
有没有人知道我是否错过了R中的实现?或者,如果有办法在包外实现这种方法?
(我意识到我可以通过将每个3因素组合作为一个级别来将我的全因子设计转换为单一治疗,但是这样的分析没有帮助.)
我正在尝试使用dplyr(ver 0.4.1)中的bind_rows()函数,但是R命令行找不到该函数.它可以找到该功能的帮助,但任何使用该功能的努力都得到满足
> bind_rows()
Error: could not find function "bind_rows"
Run Code Online (Sandbox Code Playgroud)
难道我做错了什么?我知道bind_rows()仅在ver 0.4.0中引入,但我有一个比它更新的版本.
这是我的sessionInfo()
> R version 3.1.1 (2014-07-10)
> Platform: x86_64-apple-darwin13.1.0 (64-bit)
>
> locale:
> [1] en_GB.UTF-8/en_GB.UTF-8/en_GB.UTF-8/C/en_GB.UTF-8/en_GB.UTF-8
>
> attached base packages:
> [1] utils datasets graphics grDevices stats methods base
>
> other attached packages:
> [1] lubridate_1.3.3 tidyr_0.2.0 dplyr_0.4.1 swirl_2.2.16 mvoutlier_2.0.5 sgeostat_1.0-25
>
>loaded via a namespace (and not attached):
> [1] assertthat_0.1 colorspace_1.2-4 DEoptimR_1.0-1 digest_0.6.4 GGally_0.4.8
> [6] ggplot2_1.0.0 grid_3.1.1 gtable_0.1.2 httr_0.5 magrittr_1.0.1
>[11] MASS_7.3-34 memoise_0.2.1 …Run Code Online (Sandbox Code Playgroud) 我发现了mlogit- 多项logit模型的包,用于寻找多项式混合logit模型.在阅读了优秀的插图后,我发现我无法在任何描述的示例中应用我的数据.
我现在写信希望对我的问题有所帮助,并创建了一个简单的例子来说明我的情况.
问题如下:在某处有辅音'Q'的单词.现在,我们进行了一项实验,他们的任务是听取这些话,并说他们是否听过Q,U或其他辅音.这必须依赖于诸如音节位置或真实/非真实单词之类的一些因素来建模.
在最小的例子中,我用音节位置创建了4个人和他们的答案.
library(mlogit)
library(nnet)
set.seed(1234)
data <- data.frame(personID = as.factor(sample(1:4, 40, replace=TRUE)),
decision = as.factor(sample(c("Q","U", "other"), 40, replace=TRUE)),
syllable = as.factor(sample(1:4, 40, replace=TRUE)))
summary(data)
personID decision syllable
1:11 other:10 1:18
2:10 Q :18 2: 9
3:10 U :12 3: 5
4: 9 4: 8
Run Code Online (Sandbox Code Playgroud)
据我所知nnet,multinom功能不包括混合型号.
modNnet1 <- multinom(decision ~ syllable, data=data)
Run Code Online (Sandbox Code Playgroud)
首先,我使用mlogit.data-function来重塑文件.在与同事讨论后,我们得出结论,没有替代品.特定.变量.
dataMod <- mlogit.data(data, shape="wide", choice="decision", id.var="personID")
mod1 <- mlogit(formula = decision ~ 0|syllable,
data = …Run Code Online (Sandbox Code Playgroud) 我在一个文件夹中有大约 700,000 个文件,我需要在其中查找多个字符串并将其替换为不同的其他字符串(所有 4 个字符代码)。不确定文件中是否存在字符串。我正在尝试使用 gsub,但我找不到如何使用正则表达式进行操作。有人可以告诉我处理这项任务的好方法吗?
这是我到目前为止使用的代码。它只适用于一条y <- gsub(...)指令,但不适用于我的目的,显然是因为在定义 y 变量时只考虑了最后一条 gsub 指令......
chm_files <- list.files(getwd(), pattern=("^[[:digit:]]*.chm$"), full.names=F)
for(chm_file in chm_files) {
x <- readLines(chm_file)
y <- gsub("AG02|AG07|AG05|AG18|AG19|AG08|AG09|AG17", "AGRL", x)
y <- gsub("SB28|SB42|SB43|SB33|SB41|SB34|SB39|SB35", "SWHT", x)
y <- gsub("WB28|WB42|WB43|WB32|WB09|WB33|WB41|WB26", "BARL", x)
y <- gsub("WW02|WW25|WW08|WW31|WW05|WW28|WW19|WW42", "WWHT", x)
cat(y, file=chm_file, sep="\n")
}
Run Code Online (Sandbox Code Playgroud) 我使用OLS拟合线性模型,并使用R中的函数比例缩放我的回归量,因为变量之间的度量单位不同.然后,我使用lm命令拟合模型并获得拟合模型的系数.据我所知,拟合模型的系数与原始回归量变量的系数不同,因此必须先缩小才能解释.我一直在寻找一种无法找到任何东西的直接方法.有谁知道这是怎么做到的吗?
请查看代码,能否请您帮我实施您提出的建议?
library(zoo)
filename="DataReg4.csv"
filepath=paste("C:/Reg/",filename, sep="")
separator=";"
readfile=read.zoo(filepath, sep=separator, header=T, format = "%m/%d/%Y", dec=".")
readfile=as.data.frame(readfile)
str(readfile)
DF=readfile
DF=as.data.frame(scale(DF))
fm=lm(USD_EUR~diff_int+GDP_US+Net.exports.Eur,data=DF)
summary(fm)
plot(fm)
Run Code Online (Sandbox Code Playgroud)
对不起,这是数据.
我正在尝试对死亡率数据进行Tukey检验,我想测试死亡率是否受铜量(单因素方差分析)和铜与温度的组合(双向ANOVA)的影响.这些是我的公式:
lm2<-lm(Mortality~Cu)
anova(lm2)
TukeyHSD(aov(Mortality~Cu))
lm2<-lm(Mortality~Cu+Temp+Cu:Temp)
anova(lm2)
TukeyHSD(aov(Mortality~Cu+Temp+Cu:Temp))
Run Code Online (Sandbox Code Playgroud)
ANOVA没问题,但是对于Tukey's,我收到以下错误信息:
Error in TukeyHSD.aov(aov(Mortality ~ Cu + Temp + Cu:Temp)) :
no factors in the fitted model
In addition: Warning messages:
1: In replications(paste("~", xx), data = mf) : non-factors ignored: Cu
2: In replications(paste("~", xx), data = mf) : non-factors ignored: Temp
3: In replications(paste("~", xx), data = mf) :
non-factors ignored: Cu, Temp
Run Code Online (Sandbox Code Playgroud)
我在其他帖子上看到应该有某个因素,但我的所有数据都是数字!我很困惑,不知道接下来该做什么.
在此先感谢您的帮助!
Lundill
aov可以通过以下model.tables函数获得最小二乘平均值及其对象的标准误差:
npk.aov <- aov(yield ~ block + N*P*K, npk)
model.tables(npk.aov, "means", se = TRUE)
Run Code Online (Sandbox Code Playgroud)
我想知道如何得到广义最小二乘意味着它们的标准误差nlme或lme4对象:
library(nlme)
data(Machines)
fm1Machine <- lme(score ~ Machine, data = Machines, random = ~ 1 | Worker )
Run Code Online (Sandbox Code Playgroud)
任何评论和提示将受到高度赞赏.谢谢
我有随时间变化的通量数据,并希望获得通量从负变为正或反之的时间列表.这看起来很简单,所以它可能有一个简单的答案,但我找不到我的搜索条件.
样本数据:
day=c(1,2,3,5,10,20)
flux=c(-2,-4,1,-2,4,11)
Run Code Online (Sandbox Code Playgroud)
我想得到一个类似矢量crossover_times =(2.5,4,7.5)的东西来表示变化发生的插值天数,理想情况下,还有表明符号变化走向的信息,例如sign_changes =(正,负,正).
当然,我可以编写一个循环来迭代数据,但我猜测R有一个或多个有用的功能.有什么建议?
我正在学习tidyverse并遇到了最简单操作的问题:读取单个单元格并将值分配给单个单元格。我需要通过匹配另一列中的特定值并调用我想要更改其值的列的名称来完成此操作(因此我不能使用数字行号和列号)。
我已经在网上和 SO 上搜索并阅读了 tibble 文档(这似乎是最适用的https://tibble.tidyverse.org/reference/subsetting.html?q=cell),但还没有找到答案。(我可能遗漏了一些东西 - 对于这个问题的简单性以及是否在其他地方得到了回答表示歉意)
\n\ntest<-tibble(x = 1:5, y = 1, z = x ^ 2 + y)
产量:
\n\n A tibble: 5 x 3\n x y z\n <int> <dbl> <dbl>\n1 1 1 2\n2 2 1 5\n3 3 1 10\n4 4 1 17\n5 5 1 26\nRun Code Online (Sandbox Code Playgroud)\n\ntest["x"==3,"z"]
产量:
\n\n A tibble: 0 x 1\n \xe2\x80\xa6 with 1 variable: z <dbl>\nRun Code Online (Sandbox Code Playgroud)\n\n但没有告诉我该单元格的值。
\n\n当我尝试分配一个值时......
\n\ntest["x"==3,"z"]<-20
...这是行不通的。 …
r ×10
mixed-models ×2
regression ×2
anova ×1
continuous ×1
date ×1
dplyr ×1
gsub ×1
lme4 ×1
lsmeans ×1
mlogit ×1
multinomial ×1
nlme ×1
package ×1
threshold ×1
tibble ×1
time-series ×1
transform ×1