小编km5*_*041的帖子

修改geom_ribbon边框

我正在用下面的代码绘制一系列的手段和标准偏差,我正在尝试使用geom_ribbon来显示sd,见下文.

由于重要的重叠,我想为色带添加一个边框,这个色带与相应的变量颜色相同但是是一条虚线,但我无法弄清楚代码中的哪个位置.我知道"color"和"linetype"命令以某种方式涉及......

谢谢!

graph.msd <- ggplot(data=g.data, aes(x=quarter,y=mean,group=number)) 
graph.msd <- graph.msd + geom_line(aes(colour = number),size=1)+geom_ribbon(aes(ymin=mean-sd,ymax=mean+sd,fill=number),linetype=2,alpha=0.1)
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

8
推荐指数
1
解决办法
1万
查看次数

R:大型 (&gt;20GB) 文件的 xmlEventParse 期间的内存管理

基于上一个问题(请参阅此处),我尝试通过 xmlEventParse 读取许多大型 xml 文件,同时保存节点变化的数据。使用此示例 xml: https: //www.nlm.nih.gov/databases/dtd/medsamp2015.xml

下面的代码使用 xpathSapply 提取必要的值,并使用一系列 if 语句以将唯一值 (PMID) 与记录中的每个非唯一值 (LastName) 相匹配的方式组合这些值 - 对于这些值,可能存在没有姓氏。目标是一路写入一系列小的 csv(此处为每 1000 个姓氏之后),以最大限度地减少内存使用量。

当在全尺寸数据集上运行时,代码成功批量输出文件,但是某些内容仍然存储在内存中,一旦使用所有 RAM,最终会导致系统错误。我在代码运行时观察了任务管理器,并且可以看到 R 的内存随着程序的进展而增长。如果我在运行中停止程序,然后清除 R 工作区(包括隐藏项目),则内存似乎仍被 R 使用。直到我关闭 R 后,内存才会再次释放。

自己运行几次,即使在清除工作区之后,您也会发现 R 的内存使用量仍在增长。

请帮忙!对于以这种方式读取大型 XML 文件的其他人来说,此问题似乎很常见(请参阅此问题中的示例注释)。

我的代码如下:

library(XML)

filename <- "~/Desktop/medsamp2015.xml"

tempdat <- data.frame(pmid=as.numeric(),
                      lname=character(), 
                      stringsAsFactors=FALSE) 
cnt <- 1
branchFunction <- function() {
  func <- function(x, ...) {
    v1 <- xpathSApply(x, path = "//PMID", xmlValue)
    v2 <- xpathSApply(x, path = "//Author/LastName", xmlValue)
    print(cbind(c(rep(v1,length(v2))), …
Run Code Online (Sandbox Code Playgroud)

xml memory-management r large-files xml-parsing

5
推荐指数
1
解决办法
436
查看次数

如何使用多个列中的条件创建单个虚拟变量?

我正在尝试根据数据集中的7个变量(col9-15)中的一个或多个取特定值(35),在我的数据集中有效地创建二进制虚拟变量(1/0),但是我不想测试所有列。

通常,as.numeric是理想的,但我一次只能使它与一列一起工作:

data$indicator <- as.numeric(data$col1 == 35)
Run Code Online (Sandbox Code Playgroud)

知道如何修改上面的代码,以便如果任何一个data$col9- data$col15为“ 35”,那么我的指标变量取1?

谢谢!!!

r binary-data indicator categories dummy-data

1
推荐指数
1
解决办法
2572
查看次数

找到两个变量名称标量的并集

我有一个Stata程序,它输出一个空格分隔的变量名称的局部标量.

我有两个样品(两次一样运行程序dta)和工会(路口-出现在这两个标量变量名)存储为一个新的空间分隔的局部标(用于输入到另一个程序).

我无法弄清楚如何分割(每个空格)和/或测试每个变量名称的出现.

string local stata stata-macros

1
推荐指数
1
解决办法
42
查看次数