我一直在使用var.test和bartlett.test检查基本的方差分析假设,其中包括同质性(同质性,方差等式).单因素方差分析的程序非常简单:
bartlett.test(x ~ g) # where x is numeric, and g is a factor
var.test(x ~ g)
Run Code Online (Sandbox Code Playgroud)
但是,对于2x2表,即双向ANOVA,我想做这样的事情:
bartlett.test(x ~ c(g1, g2)) # or with list; see latter:
var.test(x ~ list(g1, g2))
Run Code Online (Sandbox Code Playgroud)
当然,可以使用图形化程序检查ANOVA假设,但是"算术选项"呢?这根本就是可管理的吗?你如何在双因素方差分析中测试同性恋?
我已经使用Emacs/ESS很长一段时间了,我熟悉Hadley的R风格推荐.我想在ESS中遵循这些约定,比如运算符周围的空格,逗号后面的空格和后面的if语句,花括号之前等等.
是否有人甚至不愿意遵循这种风格指南?恕我直言,官方风格的建议相当谦虚,他们对风格一无所知.Google R风格指南与我在JavaScript中编码时使用的类似,所以这是禁忌.
长话短说:有没有(e)LISP技能愿意为ESS实施(哈德利)风格指南的人?
我想使用正则表达式来查看字符串是否不以某种模式开头.虽然我可以使用:[^将某些字符列入黑名单,但我无法弄清楚如何将模式列入黑名单.
> grepl("^[^abc].+$", "foo")
[1] TRUE
> grepl("^[^abc].+$", "afoo")
[1] FALSE
Run Code Online (Sandbox Code Playgroud)
我想做类似的事情grepl("^[^(abc)].+$", "afoo")并获得TRUE,即如果字符串不是以abc序列开始匹配.
请注意,我知道这篇文章,我也尝试过使用perl = TRUE,但没有成功:
> grepl("^((?!hede).)*$", "hede", perl = TRUE)
[1] FALSE
> grepl("^((?!hede).)*$", "foohede", perl = TRUE)
[1] FALSE
Run Code Online (Sandbox Code Playgroud)
有任何想法吗?
我创建了一个具有多个字段的模型,这些字段应该接受相同的数据格式(字符串,但可以是任何东西,FWIW).我想将相同的验证规则应用于所有这些字段.当然,我可以继续复制/粘贴东西,但那样会违反DRY原则,而且常识也是......
我想这个很容易,但我是一个Rails新人/时髦人士,所以请原谅一个微不足道的问题.=)
每当我必须重新编码一组变量时,我都会考虑SPSS重新编码功能.我必须承认这很简单.包中有一个类似的recode功能car,它可以解决这个问题,但我们假设我希望完成任务factor.
我有data.frame几个变量值,范围从1到7.我想"反转"变量值,因此用7s替换1s,用6s替换2s,用5s替换3s等.我可以使用factor函数:
# create dummy factor
set.seed(100)
x <- as.factor(round(runif(100,1,7)))
y <- factor(x, levels = rev(levels(x)))
Run Code Online (Sandbox Code Playgroud)
如果我跑:
> levels(x)
[1] "1" "2" "3" "4" "5" "6" "7"
> levels(y)
[1] "7" "6" "5" "4" "3" "2" "1"
Run Code Online (Sandbox Code Playgroud)
当我想重新编码没有相同级别的因子时,问题就开始了.如果某个因子z有水平c("1", "3", "4", "6", "7"),是否有可能通过利用factor函数来"反转"水平,所以1 = 7,2 = 6,3 = 5等?
其他有效的重新编码功能就足够了!
我一直在使用xtable包装很长一段时间,并期待在R中编写我的第一个包...所以我认为如果我有一些值得注意的"酷"想法,那么很有可能之前有人到过那里我...... =)
我对专门用于创建LaTeX表的函数/包感兴趣(当然是通过R).我碰到了quantreg有latex.table功能的包装.对类似功能/包的任何建议?
PS我正在考虑构建一个webapp,用户可以在其中定义自己的表格预设/模板,选择样式,统计等.这是一个早期的想法,尽管...... =)
像往常一样,我得到了一些SPSS文件,我已经使用包中的spss.get函数导入到R中Hmisc.我被添加到所有变量中的labelled类所困扰,因此想要删除它.Hmisc::spss.getdata.frame
labelled当我尝试跑步ggplot或甚至当我想做一些卑鄙的分析时,课程让我头疼!一种解决方案是从中删除labelled每个变量的类data.frame.我怎样才能做到这一点?这有可能吗?如果没有,我的其他选择是什么?
我真的想绕过"从零开始"与重新编辑变量as.data.frame(lapply(x, as.numeric)),并as.character在适用情况下......我当然不希望运行SPSS并手动删除标签(不喜欢SPSS,也不关心安装它)!
谢谢!
我有以下简单数据
data <- structure(list(status = c(9, 5, 9, 10, 11, 10, 8, 6, 6, 7, 10,
10, 7, 11, 11, 7, NA, 9, 11, 9, 10, 8, 9, 10, 7, 11, 9, 10, 9,
9, 8, 9, 11, 9, 11, 7, 8, 6, 11, 10, 9, 11, 11, 10, 11, 10, 9,
11, 7, 8, 8, 9, 4, 11, 11, 8, 7, 7, 11, 11, 11, 6, 7, 11, 6,
10, 10, 9, 10, 10, 8, 8, 10, 4, 8, …Run Code Online (Sandbox Code Playgroud) 让我们假设你有R运行root/admin权限.除了system()和之外,你认为哪些R会有害file.*()?
这是一个特定于平台的问题,我正在运行Linux,因此我对特定于Linux的安全漏洞感兴趣.我会理解你是否阻止关于R的讨论,因为这篇文章可以很容易地出现在"如何用R来搞乱系统?"
我很确定你们都同意这rle是R中那些"陷阱"函数之一.是否有任何类似的函数可以"捕获"相邻整数值的"运行"?
所以,如果我有一个像这样的矢量:
x <- c(3:5, 10:15, 17, 22, 23, 35:40)
Run Code Online (Sandbox Code Playgroud)
我称之为深奥的功能,我会得到这样的响应:
lengths: 3, 6, 1, 2, 6
values: (3,4,5), (10,11,12... # you get the point
Run Code Online (Sandbox Code Playgroud)
编写这样的函数并不难,但仍然......任何想法?