小编amo*_*amo的帖子

使用dplyr在多个列之间求和

我的问题涉及在数据框的多个列中汇总值,并使用创建与此求和相对应的新列dplyr.列中的数据条目是二进制(0,1).我正在考虑一个行summarise_each或类的mutate_each函数dplyr.以下是数据框的最小示例:

library(dplyr)
df=data.frame(
  x1=c(1,0,0,NA,0,1,1,NA,0,1),
  x2=c(1,1,NA,1,1,0,NA,NA,0,1),
  x3=c(0,1,0,1,1,0,NA,NA,0,1),
  x4=c(1,0,NA,1,0,0,NA,0,0,1),
  x5=c(1,1,NA,1,1,1,NA,1,0,1))

> df
   x1 x2 x3 x4 x5
1   1  1  0  1  1
2   0  1  1  0  1
3   0 NA  0 NA NA
4  NA  1  1  1  1
5   0  1  1  0  1
6   1  0  0  0  1
7   1 NA NA NA NA
8  NA NA NA  0  1
9   0  0  0  0  0
10  1  1 …

Run Code Online (Sandbox Code Playgroud)

r dplyr

amo*_*amo

lucky-day

75
推荐指数

7
解决办法

9万
查看次数

通过插件管理器在Notepad ++中配置代理设置

我想在Notepad ++中配置代理设置,以允许通过代理从Internet下载.在从网上搜索了如何做到这一点后,我了解到我需要在插件管理器中通过"设置"按钮执行此操作.当我去插件>插件管理器>显示插件管理器>设置时,我得到下面的对话框,它没有给我任何指示代理设置的选项.我如何达到指示代理设置所需的点？

windows proxy notepad++

amo*_*amo

lucky-day

19
推荐指数

3
解决办法

4万
查看次数

计算自R上次事件以来的天数

我的问题涉及如何计算自R中发生的事件以来的天数.以下是数据的最小示例:

df <- data.frame(date=as.Date(c("06/07/2000","15/09/2000","15/10/2000","03/01/2001","17/03/2001","23/05/2001","26/08/2001"), "%d/%m/%Y"), 
event=c(0,0,1,0,1,1,0))
        date event
1 2000-07-06     0
2 2000-09-15     0
3 2000-10-15     1
4 2001-01-03     0
5 2001-03-17     1
6 2001-05-23     1
7 2001-08-26     0

Run Code Online (Sandbox Code Playgroud)

二进制变量(事件)的值为1,表示事件发生,否则为0.重复观察在不同时间完成(date)预期输出如下,自上次事件(tae)以来的日期:

 date        event       tae
1 2000-07-06     0        NA
2 2000-09-15     0        NA
3 2000-10-15     1         0
4 2001-01-03     0        80
5 2001-03-17     1       153
6 2001-05-23     1        67
7 2001-08-26     0        95

Run Code Online (Sandbox Code Playgroud)

我一直在寻找类似问题的答案,但他们没有解决我的具体问题.我试图从类似的帖子(计算自上次事件以来经过的时间)实现想法,下面是我最接近解决方案:

library(dplyr)
df %>%
  mutate(tmp_a = c(0, diff(date)) * !event,
         tae = cumsum(tmp_a)) …

Run Code Online (Sandbox Code Playgroud)

r time-series

amo*_*amo

2017 05-23

17
推荐指数

1
解决办法

2412
查看次数

基于正则表达式创建新变量

我的问题涉及如何根据正则表达式的结果在R中的数据框上创建新变量.以下是数据的最小示例:

df <- data.frame(model=c("Legacy 2.0  BG5 B4 AUTO","Legacy 2.0 BH5 AT","Legacy 2.0i CVT Non Leather","Legacy 2.0i CVT","Legacy 2.0 BL5 AUTO B4",
                 "Legacy 2.0 BP5 AUTO","Legacy 2.0 BM5 AUTO CVT"), CRSP=c(3450000,3365000,4950000,5250000,4787526,3550000,5235000))

df
                        model    CRSP
1     Legacy 2.0  BG5 B4 AUTO 3450000
2           Legacy 2.0 BH5 AT 3365000
3 Legacy 2.0i CVT Non Leather 4950000
4             Legacy 2.0i CVT 5250000
5      Legacy 2.0 BL5 AUTO B4 4787526
6         Legacy 2.0 BP5 AUTO 3550000
7     Legacy 2.0 BM5 AUTO CVT 5235000

Run Code Online (Sandbox Code Playgroud)

我想创建一个新的变量'chassis',其值是相应的'model'变量字符串的第三个元素,因此最终得到:

df …

Run Code Online (Sandbox Code Playgroud)

regex r

amo*_*amo

lucky-day

15
推荐指数

3
解决办法

918
查看次数

在R中导入数据集时跳过元数据

我的问题涉及如何在将数据导入R时跳过文件开头的元数据.我的数据是.txt格式,其中第一行是描述数据的元数据,需要过滤掉这些数据.下面是制表符分隔格式的数据框的最小示例:

Type=GenePix Export                         
DateTime=2010/03/04 16:04:16                        
PixelSize=10                        
Wavelengths=635                     
ImageFiles=Not Saved                        
NormalizationMethod=None                        
NormalizationFactors=1                      
JpegImage=                      
StdDev=Type 1                       
FeatureType=Circular                        
Barcode=                        
BackgroundSubtraction=LocalFeature                      
ImageOrigin=150, 10                     
JpegOrigin=150, 2760                        
Creator=GenePix Pro 7.2.29.002                      
var1    var2    var3    var4    var5    var6    var7
1   1   1   molecule1   1F3 400 4020
1   2   1   molecule2   1B5 221 4020
1   3   1   molecule3   1H5 122 2110
1   4   1   molecule4   1D1 402 2110
1   5   1   molecule5   1F1 600 4020

Run Code Online (Sandbox Code Playgroud)

如果我知道实际数据的起始行,我可以使用下面显示的基本命令:

mydata <- read.table("mydata.txt",header=T, skip=15)

Run Code Online (Sandbox Code Playgroud)

哪个会回归;

mydata
  var1 var2 var3      var4 var5 var6 var7 …

Run Code Online (Sandbox Code Playgroud)

r sqldf

amo*_*amo

lucky-day

7
推荐指数

1
解决办法

301
查看次数

在 R 中注释维恩图

我的问题涉及如何使用任何 R 包用除了默认计数之外的实际值来注释维恩图。以下是数据的最小示例：

list.items <- list(method1=c("item1","item2","item3","item4","item5","item6"), 
                   method2=c("item1","item7","item3","item4","item8","item6"), 
                   method3=c("item1","item7","item9","item4","item10","item11"))
library(gplots)
venn(list.items)

Run Code Online (Sandbox Code Playgroud)

这将返回维恩图：在此输入图像描述例如，我想看看 method3 实际上有哪些 3 项？例如项目 3、项目 5 和项目 7。