我的问题涉及在数据框的多个列中汇总值,并使用创建与此求和相对应的新列dplyr.列中的数据条目是二进制(0,1).我正在考虑一个行summarise_each或类的mutate_each函数dplyr.以下是数据框的最小示例:
library(dplyr)
df=data.frame(
x1=c(1,0,0,NA,0,1,1,NA,0,1),
x2=c(1,1,NA,1,1,0,NA,NA,0,1),
x3=c(0,1,0,1,1,0,NA,NA,0,1),
x4=c(1,0,NA,1,0,0,NA,0,0,1),
x5=c(1,1,NA,1,1,1,NA,1,0,1))
> df
x1 x2 x3 x4 x5
1 1 1 0 1 1
2 0 1 1 0 1
3 0 NA 0 NA NA
4 NA 1 1 1 1
5 0 1 1 0 1
6 1 0 0 0 1
7 1 NA NA NA NA
8 NA NA NA 0 1
9 0 0 0 0 0
10 1 1 …Run Code Online (Sandbox Code Playgroud) 我想在Notepad ++中配置代理设置,以允许通过代理从Internet下载.在从网上搜索了如何做到这一点后,我了解到我需要在插件管理器中通过"设置"按钮执行此操作.当我去插件>插件管理器>显示插件管理器>设置时,我得到下面的对话框,它没有给我任何指示代理设置的选项.我如何达到指示代理设置所需的点?
我的问题涉及如何计算自R中发生的事件以来的天数.以下是数据的最小示例:
df <- data.frame(date=as.Date(c("06/07/2000","15/09/2000","15/10/2000","03/01/2001","17/03/2001","23/05/2001","26/08/2001"), "%d/%m/%Y"),
event=c(0,0,1,0,1,1,0))
date event
1 2000-07-06 0
2 2000-09-15 0
3 2000-10-15 1
4 2001-01-03 0
5 2001-03-17 1
6 2001-05-23 1
7 2001-08-26 0
Run Code Online (Sandbox Code Playgroud)
二进制变量(事件)的值为1,表示事件发生,否则为0.重复观察在不同时间完成(date)预期输出如下,自上次事件(tae)以来的日期:
date event tae
1 2000-07-06 0 NA
2 2000-09-15 0 NA
3 2000-10-15 1 0
4 2001-01-03 0 80
5 2001-03-17 1 153
6 2001-05-23 1 67
7 2001-08-26 0 95
Run Code Online (Sandbox Code Playgroud)
我一直在寻找类似问题的答案,但他们没有解决我的具体问题.我试图从类似的帖子(计算自上次事件以来经过的时间)实现想法,下面是我最接近解决方案:
library(dplyr)
df %>%
mutate(tmp_a = c(0, diff(date)) * !event,
tae = cumsum(tmp_a)) …Run Code Online (Sandbox Code Playgroud) 我的问题涉及如何根据正则表达式的结果在R中的数据框上创建新变量.以下是数据的最小示例:
df <- data.frame(model=c("Legacy 2.0 BG5 B4 AUTO","Legacy 2.0 BH5 AT","Legacy 2.0i CVT Non Leather","Legacy 2.0i CVT","Legacy 2.0 BL5 AUTO B4",
"Legacy 2.0 BP5 AUTO","Legacy 2.0 BM5 AUTO CVT"), CRSP=c(3450000,3365000,4950000,5250000,4787526,3550000,5235000))
df
model CRSP
1 Legacy 2.0 BG5 B4 AUTO 3450000
2 Legacy 2.0 BH5 AT 3365000
3 Legacy 2.0i CVT Non Leather 4950000
4 Legacy 2.0i CVT 5250000
5 Legacy 2.0 BL5 AUTO B4 4787526
6 Legacy 2.0 BP5 AUTO 3550000
7 Legacy 2.0 BM5 AUTO CVT 5235000
Run Code Online (Sandbox Code Playgroud)
我想创建一个新的变量'chassis',其值是相应的'model'变量字符串的第三个元素,因此最终得到:
df …Run Code Online (Sandbox Code Playgroud) 我的问题涉及如何在将数据导入R时跳过文件开头的元数据.我的数据是.txt格式,其中第一行是描述数据的元数据,需要过滤掉这些数据.下面是制表符分隔格式的数据框的最小示例:
Type=GenePix Export
DateTime=2010/03/04 16:04:16
PixelSize=10
Wavelengths=635
ImageFiles=Not Saved
NormalizationMethod=None
NormalizationFactors=1
JpegImage=
StdDev=Type 1
FeatureType=Circular
Barcode=
BackgroundSubtraction=LocalFeature
ImageOrigin=150, 10
JpegOrigin=150, 2760
Creator=GenePix Pro 7.2.29.002
var1 var2 var3 var4 var5 var6 var7
1 1 1 molecule1 1F3 400 4020
1 2 1 molecule2 1B5 221 4020
1 3 1 molecule3 1H5 122 2110
1 4 1 molecule4 1D1 402 2110
1 5 1 molecule5 1F1 600 4020
Run Code Online (Sandbox Code Playgroud)
如果我知道实际数据的起始行,我可以使用下面显示的基本命令:
mydata <- read.table("mydata.txt",header=T, skip=15)
Run Code Online (Sandbox Code Playgroud)
哪个会回归;
mydata
var1 var2 var3 var4 var5 var6 var7 …Run Code Online (Sandbox Code Playgroud) 我的问题涉及如何使用任何 R 包用除了默认计数之外的实际值来注释维恩图。以下是数据的最小示例:
list.items <- list(method1=c("item1","item2","item3","item4","item5","item6"),
method2=c("item1","item7","item3","item4","item8","item6"),
method3=c("item1","item7","item9","item4","item10","item11"))
library(gplots)
venn(list.items)
Run Code Online (Sandbox Code Playgroud)
这将返回维恩图:
例如,我想看看 method3 实际上有哪些 3 项?例如项目 3、项目 5 和项目 7。
我想要一张维恩图,例如: http://openi.nlm.nih.gov/detailedresult.php ?img=3026361_1471-2105-11-S6-S14-9&req=4 任何帮助都会很大赞赏。
r ×5
dplyr ×1
notepad++ ×1
proxy ×1
regex ×1
sqldf ×1
time-series ×1
venn-diagram ×1
windows ×1