小编km5*_*041的帖子

修改geom_ribbon边框

我正在用下面的代码绘制一系列的手段和标准偏差,我正在尝试使用geom_ribbon来显示sd,见下文.

由于重要的重叠,我想为色带添加一个边框,这个色带与相应的变量颜色相同但是是一条虚线,但我无法弄清楚代码中的哪个位置.我知道"color"和"linetype"命令以某种方式涉及......

谢谢!

graph.msd <- ggplot(data=g.data, aes(x=quarter,y=mean,group=number)) 
graph.msd <- graph.msd + geom_line(aes(colour = number),size=1)+geom_ribbon(aes(ymin=mean-sd,ymax=mean+sd,fill=number),linetype=2,alpha=0.1)

Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

km5*_*041

2013 03-20

8
推荐指数

1
解决办法

1万
查看次数

R：大型 (>20GB) 文件的 xmlEventParse 期间的内存管理

基于上一个问题（请参阅此处），我尝试通过 xmlEventParse 读取许多大型 xml 文件，同时保存节点变化的数据。使用此示例 xml： https: //www.nlm.nih.gov/databases/dtd/medsamp2015.xml。

下面的代码使用 xpathSapply 提取必要的值，并使用一系列 if 语句以将唯一值 (PMID) 与记录中的每个非唯一值 (LastName) 相匹配的方式组合这些值 - 对于这些值，可能存在没有姓氏。目标是一路写入一系列小的 csv（此处为每 1000 个姓氏之后），以最大限度地减少内存使用量。

当在全尺寸数据集上运行时，代码成功批量输出文件，但是某些内容仍然存储在内存中，一旦使用所有 RAM，最终会导致系统错误。我在代码运行时观察了任务管理器，并且可以看到 R 的内存随着程序的进展而增长。如果我在运行中停止程序，然后清除 R 工作区（包括隐藏项目），则内存似乎仍被 R 使用。直到我关闭 R 后，内存才会再次释放。

自己运行几次，即使在清除工作区之后，您也会发现 R 的内存使用量仍在增长。

请帮忙！对于以这种方式读取大型 XML 文件的其他人来说，此问题似乎很常见（请参阅此问题中的示例注释）。

我的代码如下：

library(XML)

filename <- "~/Desktop/medsamp2015.xml"

tempdat <- data.frame(pmid=as.numeric(),
                      lname=character(), 
                      stringsAsFactors=FALSE) 
cnt <- 1
branchFunction <- function() {
  func <- function(x, ...) {
    v1 <- xpathSApply(x, path = "//PMID", xmlValue)
    v2 <- xpathSApply(x, path = "//Author/LastName", xmlValue)
    print(cbind(c(rep(v1,length(v2))), …

Run Code Online (Sandbox Code Playgroud)

xml memory-management r large-files xml-parsing

km5*_*041

2017 11-10

5
推荐指数

1
解决办法

436
查看次数

如何使用多个列中的条件创建单个虚拟变量？

我正在尝试根据数据集中的7个变量（col9-15）中的一个或多个取特定值（35），在我的数据集中有效地创建二进制虚拟变量（1/0），但是我不想测试所有列。

通常，as.numeric是理想的，但我一次只能使它与一列一起工作：

data$indicator <- as.numeric(data$col1 == 35)

Run Code Online (Sandbox Code Playgroud)

知道如何修改上面的代码，以便如果任何一个data$col9- data$col15为“ 35”，那么我的指标变量取1？

谢谢！！！

r binary-data indicator categories dummy-data

km5*_*041

2013 02-22

1
推荐指数

1
解决办法

2572
查看次数

找到两个变量名称标量的并集

我有一个Stata程序,它输出一个空格分隔的变量名称的局部标量.

我有两个样品(两次一样运行程序dta)和工会(路口-出现在这两个标量变量名)存储为一个新的空间分隔的局部标(用于输入到另一个程序).

我无法弄清楚如何分割(每个空格)和/或测试每个变量名称的出现.

string local stata stata-macros

km5*_*041

2018 05-13

1
推荐指数

1
解决办法

42
查看次数

标签统计

r ×3

binary-data ×1

categories ×1

dummy-data ×1

ggplot2 ×1

indicator ×1

large-files ×1

local ×1

memory-management ×1

plot ×1

stata ×1

stata-macros ×1

string ×1

xml ×1

xml-parsing ×1

修改geom_ribbon边框

R：大型 (&gt;20GB) 文件的 xmlEventParse 期间的内存管理

如何使用多个列中的条件创建单个虚拟变量？

找到两个变量名称标量的并集

标签 统计

小编km5_041的帖子

R：大型 (>20GB) 文件的 xmlEventParse 期间的内存管理

标签统计