给出两个数据框:
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1)))
df1
# CustomerId Product
# 1 Toaster
# 2 Toaster
# 3 Toaster
# 4 Radio
# 5 Radio
# 6 Radio
df2
# CustomerId State
# 2 Alabama
# 4 Alabama
# 6 Ohio
Run Code Online (Sandbox Code Playgroud)
我怎样才能做数据库风格,即sql风格,加入?也就是说,我该怎么做:
当我承担任何复杂的R项目时,我的脚本会很快变得混乱.
我可以采用哪些做法,以便我的代码永远乐于与之合作?我在考虑类似的事情
基本上,组织大型R脚本的经验法则是什么?
r conventions code-organization project-organization package
如何暂停R脚本达指定的秒数或毫秒数?在许多语言中,都有一个sleep函数,但?sleep引用了一个数据集.而?pause和?wait不存在.
预期目的是用于自定时动画.所需的解决方案无需用户输入即可运行.
有时在R帮助页面上,评论中会出现"未运行"这一短语.请在帮助页面中查看"with()":
Examples
require(stats); require(graphics)
#examples from glm:
**## Not run:**
library(MASS)
with(anorexia, {
anorex.1 <- glm(Postwt ~ Prewt + Treat + offset(Prewt),
family = gaussian)
summary(anorex.1)
})
## End(**Not run**)
Run Code Online (Sandbox Code Playgroud)
示例代码中"未运行"的含义是什么?
我正在尝试使用图表下方的图例创建一个ggplot2图.
ggplot2书在第112页上说"传说的位置和对齐由主题设置legend.position控制,值可以是右,左,上,下,无(无图例)或数字位置".
下面的代码工作(因为它是默认的"右"),并且它也可以使用"none"作为图例位置,但是"left","top","bottom"都会失败并显示"grid in Grid.Call" .graphics("L_setviewport",pvp,TRUE):视口的非有限位置和/或大小"
library(ggplot2)
(myDat <- data.frame(cbind(VarX=10:1, VarY=runif(10)),
Descrip=sample(LETTERS[1:3], 10, replace=TRUE)))
qplot(VarX,VarY, data=myDat, shape=Descrip) +
opts(legend.position="right")
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?重新定位一个传奇必须非常普遍,所以我认为这是我.
我知道
pdf("myOut.pdf")
Run Code Online (Sandbox Code Playgroud)
将在R中打印成PDF.如果我愿意的话
制作一个循环,在PDF文件的新页面上打印后续图形(附加到末尾)?
创建一个循环,将后续图形打印到新的PDF文件(每个文件一个图形)?
我在几台机器上使用Windows下的R.
我知道你可以在R脚本中设置工作目录,就像这样
setwd("C:/Documents and Settings/username/My Documents/x/y/z")
Run Code Online (Sandbox Code Playgroud)
...但是这会破坏脚本的可移植性.必须反转所有斜杠(因为Windows为您提供反斜杠)也很烦人
有没有办法在特定的工作目录中启动R,这样您就不需要在脚本级别执行此操作了?
给出以下形式的数据
myDat = structure(list(Score = c(1.84, 2.24, 3.8, 2.3, 3.8, 4.55, 1.13,
2.49, 3.74, 2.84, 3.3, 4.82, 1.74, 2.89, 3.39, 2.08, 3.99, 4.07,
1.93, 2.39, 3.63, 2.55, 3.09, 4.76), Subject = c(1L, 1L, 1L,
2L, 2L, 2L, 3L, 3L, 3L, 4L, 4L, 4L, 5L, 5L, 5L, 6L, 6L, 6L, 7L,
7L, 7L, 8L, 8L, 8L), Condition = c(0L, 0L, 0L, 1L, 1L, 1L, 0L,
0L, 0L, 1L, 1L, 1L, 0L, 0L, 0L, 1L, 1L, 1L, 0L, 0L, 0L, 1L, 1L, …Run Code Online (Sandbox Code Playgroud) 在MySql的解释器中,将表格及其字段名称转储到屏幕上非常容易.
似乎没有简单的方法将表导出到制表符分隔或CSV输出文件,包括其列标题.
我正在尝试仅使用SQL或Linux命令行执行此操作,而无需使用其他语言编写程序.
谢谢
我们都喜欢像中位数和四分位数范围这样的强有力的测量方法,但是让我们面对它,在许多领域,箱形图几乎从未在已发表的文章中出现,而手段和标准错误一直如此.
在格子,ggplot2等中绘制箱形图很简单,画廊里装满了它们.是否有一种同样直接的方法来绘制均值和标准误差,以分类变量为条件?
我正在拍摄这样的情节:
http://freakonomics.blogs.nytimes.com/2008/07/30/how-big-is-your-halo-a-guest-post/
或者JMP中所谓的"钻石"(见图3):
http://blogs.sas.com/jmp/index.php?/archives/127-What-Good-Are-Error-Bars.html