我正在用下面的代码绘制一系列的手段和标准偏差,我正在尝试使用geom_ribbon来显示sd,见下文.
由于重要的重叠,我想为色带添加一个边框,这个色带与相应的变量颜色相同但是是一条虚线,但我无法弄清楚代码中的哪个位置.我知道"color"和"linetype"命令以某种方式涉及......
谢谢!
graph.msd <- ggplot(data=g.data, aes(x=quarter,y=mean,group=number))
graph.msd <- graph.msd + geom_line(aes(colour = number),size=1)+geom_ribbon(aes(ymin=mean-sd,ymax=mean+sd,fill=number),linetype=2,alpha=0.1)
Run Code Online (Sandbox Code Playgroud) 基于上一个问题(请参阅此处),我尝试通过 xmlEventParse 读取许多大型 xml 文件,同时保存节点变化的数据。使用此示例 xml: https: //www.nlm.nih.gov/databases/dtd/medsamp2015.xml。
下面的代码使用 xpathSapply 提取必要的值,并使用一系列 if 语句以将唯一值 (PMID) 与记录中的每个非唯一值 (LastName) 相匹配的方式组合这些值 - 对于这些值,可能存在没有姓氏。目标是一路写入一系列小的 csv(此处为每 1000 个姓氏之后),以最大限度地减少内存使用量。
当在全尺寸数据集上运行时,代码成功批量输出文件,但是某些内容仍然存储在内存中,一旦使用所有 RAM,最终会导致系统错误。我在代码运行时观察了任务管理器,并且可以看到 R 的内存随着程序的进展而增长。如果我在运行中停止程序,然后清除 R 工作区(包括隐藏项目),则内存似乎仍被 R 使用。直到我关闭 R 后,内存才会再次释放。
自己运行几次,即使在清除工作区之后,您也会发现 R 的内存使用量仍在增长。
请帮忙!对于以这种方式读取大型 XML 文件的其他人来说,此问题似乎很常见(请参阅此问题中的示例注释)。
我的代码如下:
library(XML)
filename <- "~/Desktop/medsamp2015.xml"
tempdat <- data.frame(pmid=as.numeric(),
lname=character(),
stringsAsFactors=FALSE)
cnt <- 1
branchFunction <- function() {
func <- function(x, ...) {
v1 <- xpathSApply(x, path = "//PMID", xmlValue)
v2 <- xpathSApply(x, path = "//Author/LastName", xmlValue)
print(cbind(c(rep(v1,length(v2))), …Run Code Online (Sandbox Code Playgroud) 我正在尝试根据数据集中的7个变量(col9-15)中的一个或多个取特定值(35),在我的数据集中有效地创建二进制虚拟变量(1/0),但是我不想测试所有列。
通常,as.numeric是理想的,但我一次只能使它与一列一起工作:
data$indicator <- as.numeric(data$col1 == 35)
Run Code Online (Sandbox Code Playgroud)
知道如何修改上面的代码,以便如果任何一个data$col9- data$col15为“ 35”,那么我的指标变量取1?
谢谢!!!
我有一个Stata程序,它输出一个空格分隔的变量名称的局部标量.
我有两个样品(两次一样运行程序dta)和工会(路口-出现在这两个标量变量名)存储为一个新的空间分隔的局部标(用于输入到另一个程序).
我无法弄清楚如何分割(每个空格)和/或测试每个变量名称的出现.
r ×3
binary-data ×1
categories ×1
dummy-data ×1
ggplot2 ×1
indicator ×1
large-files ×1
local ×1
plot ×1
stata ×1
stata-macros ×1
string ×1
xml ×1
xml-parsing ×1