我安装了R版3.0.2.我正在尝试对数据集运行关联分析.
在尝试安装arules软件包时,使用以下代码:
install.packages(“arules”)
Run Code Online (Sandbox Code Playgroud)
我得到并且错误:
错误:"install.packages("arules")中的意外输入
您可以指导我如何安装此软件包并使用它来使用R在导入的txt文件上运行关联吗?
我在ubuntu精确穿山甲在VM内运行,使用R 3.1和Rstudio 0.98.507并且我无法安装ggplot2
这是输出:
install.packages('ggplot2')
Installing package into ‘/home/uwhpsc/R/i686-pc-linux-gnu-library/3.1’
(as ‘lib’ is unspecified)
also installing the dependencies ‘colorspace’, ‘Rcpp’, ‘stringr’, ‘RColorBrewer’, ‘dichromat’, ‘munsell’, ‘labeling’, ‘plyr’, ‘digest’, ‘gtable’, ‘reshape2’, ‘scales’, ‘proto’
trying URL 'http://cran.rstudio.com/src/contrib/colorspace_1.2-4.tar.gz'
Content type 'application/x-gzip' length 242791 bytes (237 Kb)
opened URL
==================================================
downloaded 237 Kb
trying URL 'http://cran.rstudio.com/src/contrib/Rcpp_0.11.1.tar.gz'
Content type 'application/x-gzip' length 2003515 bytes (1.9 Mb)
opened URL
==================================================
downloaded 1.9 Mb
trying URL 'http://cran.rstudio.com/src/contrib/stringr_0.6.2.tar.gz'
Content type 'application/x-gzip' length 20636 bytes (20 Kb)
opened URL
==================================================
downloaded 20 …Run Code Online (Sandbox Code Playgroud) 我是R data.table软件包的新用户,我注意到data.tables中有一些不寻常的地方,在文档或本网站上的其他地方都找不到。
在Rstudio package中使用data.table 并在“环境”面板中查看特定的data.table时,我看到以下字符串出现在data.table的末尾
attr(*,“ internal.selref”)= <externalptr>
如果在控制台中打印相同的data.table,则不会出现此字符串。
这是Bug,还是data.table(或Rstudio)的固有功能?我是否应该担心这是否会影响下游流程如何处理这些数据?
我正在运行的版本如下:
data.table版本1.9.6 Rstudio版本0.99.447 OSX 10.10.5
如果这只是我一个无知的新手,请提前道歉。
我有一个分位数回归模型,我有兴趣估计.25,.5和.875分位数的效果.我的模型中的系数彼此不同,其方式符合我的模型的实质性实质理论.
下一步是测试一个分位数的特定解释变量的系数是否与另一个分位数的估计系数显着不同.我该如何测试?此外,我还想测试给定分位数的该变量的系数是否与OLS模型中的estimnate显着不同.我怎么做?
我对任何答案感兴趣,虽然我更喜欢一个涉及R的答案.这里有一些测试代码:(注意:这不是我的实际模型或数据,但是一个简单的例子,因为数据在R安装中可用)
data(airquality)
library(quantreg)
summary(rq(Ozone ~ Solar.R + Wind + Temp, tau = c(.25, .5, .75), data = airquality, method = "br"), se = "nid")
tau: [1] 0.25
Coefficients:
Value Std. Error t value Pr(>|t|)
(Intercept) -69.92874 12.18362 -5.73957 0.00000
Solar.R 0.06220 0.00917 6.77995 0.00000
Wind -2.63528 0.59364 -4.43918 0.00002
Temp 1.43521 0.14363 9.99260 0.00000
Call: rq(formula = Ozone ~ Solar.R + Wind + Temp, tau = c(0.25, 0.5,
0.75), data = airquality, method = "br")
tau: [1] 0.5 …Run Code Online (Sandbox Code Playgroud) 我制作了一个带有要求 3 个值的函数的包,如下所示:
example.foo("directory",vA1,vA2)
Run Code Online (Sandbox Code Playgroud)
现在,我想为 vA1 和 vA2 设置一个默认值。我写了下面的一段代码,但我不知道为什么它不起作用
if (!exists("vA1")) {
vA1 = 2
}
Run Code Online (Sandbox Code Playgroud)
2 是 vA1 的默认值。当我运行包时,我得到一个“参数“vA1”丢失,没有默认值”。如何设置此功能的默认值?谢谢!
我正在进行一些粘度实验,我正试图用ν对θ进行Eyring绘图.当我创建情节时,ggplot2我无法显示我的模型.
这些是使用的值:
> theta
[1] 25 30 35 40 45
> nu
[1] 1.448462 1.362730 1.255161 1.167408 1.083005
Run Code Online (Sandbox Code Playgroud)
在这里,我使用上面的值创建绘图:
plot <-
ggplot()+
geom_point(mapping = aes(theta, nu), colour = "#0072bd", size = 4, shape = 16)+
theme_bw()+
labs(
x = expression(paste(theta, " ", "[°C]")),
y = expression(paste("ln(", nu, ")", " ", "[mPa*s]")))+
ylim(0, 10)+
xlim(0, 100)
Run Code Online (Sandbox Code Playgroud)
现在,我添加我的模型 geom_smooth()
plot +
geom_smooth(
method = "nls",
method.args = list(formula = nu~a*exp(b/theta),
start=list(a=1, b=0.1)))
Run Code Online (Sandbox Code Playgroud)
但没有任何反应......甚至没有错误信息,情节看起来和以前一样.
我也尝试将formula直接作为geom_smooth()参数和起始值,
plot …Run Code Online (Sandbox Code Playgroud) 我需要data.frame通过一些变量进行拆分,并计算每一行的值与来自其他指定行的值之间的差异.
在下面的例子中,我分手df了v1.然后为每一行v3计算实际值与之间的差值v3[v2 == "C"].
v1 <- rep(1:4,each = 3)
v2 <- rep(c("A","B","C"),4)
v3 <- rep(1:5,3)[1:12]
res <- c(-2,-1,0,3,4,0,-2,-1,0,3,-1,0)
df <- data.frame(v1,v2,v3,res)
df
v1 v2 v3 res
1 1 A 1 -2
2 1 B 2 -1
3 1 C 3 0
4 2 A 4 3
5 2 B 5 4
6 2 C 1 0
7 3 A 2 -2
8 3 B 3 -1
9 3 C 4 …Run Code Online (Sandbox Code Playgroud) 我知道使用该lubridate包,我可以为每个输入日期生成相应的工作日.我现在正在处理一个包含大量日期条目的大型数据集,我希望为每个日期条目提取工作日.我认为搜索每个日期并找工作日是不可能的.我希望有一个功能,允许我从我的数据框插入我的日期列,并将产生与框架的每个日期对应的天数.
我的框架就像
uinq_id Product_ID Date_of_order count
1 Aarkios04_2014-09-09 Aarkios04 2014-09-09 10
2 ABEE01_2014-08-18 ABEE01 2014-08-18 1
3 ABEE01_2014-08-19 ABEE01 2014-08-19 0
4 ABEE01_2014-08-20 ABEE01 2014-08-20 0
5 ABEE01_2014-08-21 ABEE01 2014-08-21 0
6 ABEE01_2014-08-22 ABEE01 2014-08-22 0
Run Code Online (Sandbox Code Playgroud)
我想要生成
uinq_id Product_ID Date_of_order count weekday
1 Aarkios04_2014-09-09 Aarkios04 2014-09-09 10 Tues
2 ABEE01_2014-08-18 ABEE01 2014-08-18 1 Mon
3 ABEE01_2014-08-19 ABEE01 2014-08-19 0 Tues
4 ABEE01_2014-08-20 ABEE01 2014-08-20 0 Wed
5 ABEE01_2014-08-21 ABEE01 2014-08-21 0 Thurs
6 ABEE01_2014-08-22 ABEE01 2014-08-22 0 Fri …Run Code Online (Sandbox Code Playgroud) 尝试rvest在R中使用包时收到以下错误:
open.connection(x,"rb")出错:无法连接到服务器
是什么导致此错误消息?功能如下所示:
htmlpage <- read_html("http://forecast.weather.gov/MapClick.php?lat=42.27925753000045&lon=-71.41616624299962#.V17UH-IrKHs")
Run Code Online (Sandbox Code Playgroud) 在RI合并两个向量a和b:
a <- c(100,250)
b <- c(0,100,200)
foo <- merge(a,b,all=TRUE)
Run Code Online (Sandbox Code Playgroud)
当我检查foo时,我看到merge函数命名了两列x和y:
> foo
x y
1 100 0
2 250 0
3 100 100
4 250 100
5 100 200
6 250 200
Run Code Online (Sandbox Code Playgroud)
是否有一种优雅的方法可以将原始变量名称保留为结果数据框中的列名?"优雅"我指的是比明确重命名列更简单的东西.