小编use*_*870的帖子

用NA值绘制置信区间

我想使用Gviz包将置信区间映射到具有NA的数据.我修改了手动示例来揭露我的问题.首先作为手册曝光:

library(Gviz)

## Loading GRanges object
data(twoGroups)

## Plot data without NAs
dTrack <- DataTrack(twoGroups, name = "uniform")
tiff("Gviz_original.tiff", units="in", width=11, height=8.5, res=200, compress="lzw")
plotTracks(dTrack, groups = rep(c("control", "treated"),
                                each = 3), type = c("a", "p", "confint"))
graphics.off()

Run Code Online (Sandbox Code Playgroud)

现在,使用包含NA值和值的数据na.rm=TRUE:

  ## Transforming in data frame
  df <- as.data.frame(twoGroups)

## Input NAs to look like my real data
df[ df <= 0 ] = NA
df <- df[,-4]
df <- df[,-4]
names(df) <- c("chr", "start", "end", …

Run Code Online (Sandbox Code Playgroud)

graphics plot r bioconductor confidence-interval

use*_*870

2015 08-03

17
推荐指数

1
解决办法

1056
查看次数

排除后续重复的行

我想排除所有重复的行.但是,只有当它们是后续行时才必须如此.遵循一个代表性的例子:

我的意见df:

    df <- "NAME   VALUE 
    Prb1  0.05
    Prb2  0.05
    Prb3  0.05
    Prb4  0.06
    Prb5  0.06
    Prb6  0.01
    Prb7  0.10
    Prb8  0.05"

df <- read.table(text=df, header=T)

Run Code Online (Sandbox Code Playgroud)

我的期望outdf:

outdf <- "NAME   VALUE 
Prb1  0.05
Prb4  0.06
Prb6  0.01
Prb7  0.10
Prb8  0.05"

outdf <- read.table(text=df, header=T)

Run Code Online (Sandbox Code Playgroud)

conditional duplicate-data r

use*_*870

2015 05-16

15
推荐指数

3
解决办法

367
查看次数

基于来自另一个的特定数字间隔子集一个数据帧

我想df1基于超出特定数字区间的值的子集df2.

我的意见df1和df2:

df1 <- 'name sam1 sam2 sam3  
        AZ1  2.65  2.56  2.65
        AX1  2.22  2.41  2.85
        AX2  2.45  2.45  2.85'
df1 <- read.table(text=df1, header=T)

df2 <- 'name sam1 sam2 sam3  
        AZ1  1  0  1
        AX1  0.75  0.55  1
        AX2  0  0  0.62'
df2 <- read.table(text=df2, header=T)

Run Code Online (Sandbox Code Playgroud)

我尝试使用以下代码将其子集化但未成功:

out <- df1[if(df2 >= 0.90) |if(df2 <= 0.10) | if(df2 <= 0.60 && df2 >= 0.40)]

Run Code Online (Sandbox Code Playgroud)

我试图仅将df1具有高于0.90 或低于0.1 或 0.4到0.6之间的值的单元进行子集(反之:NA到x间隔:0.40> …

syntax r subset

use*_*870

lucky-day

3
推荐指数

1
解决办法

99
查看次数

根据剩余的列更改第一列

我想改变组(S1...... S5)在Var1列描绘最多的Freq列S1,第二大的作为S2等.请注意,这种情况下的因素是Position列中的数字.因此,对于Position == 26998698,例如,我们将与结束1587作为S1在output代替S3,340如S2在output代替S4等.

df <- 'Var1 Freq Position
S1    1 26998698
S2  125 26998698
S3 1587 26998698
S4  340 26998698
S5    8 26998698
S1   68 27252684
S2  703 27252684
S3  913 27252684
S4  293 27252684
S5   58 27252684
S1    7 27209738
S2  383 27209738
S3 1425 27209738
S4 …

Run Code Online (Sandbox Code Playgroud)

replace r

use*_*870

2016 03-01

3
推荐指数

1
解决办法

47
查看次数

用中位数替换df中的所有数字

我想用df行的中位数替换我的所有数字,保持NA值.这是我的意见:

df <- 'pr_id  sample1  sample2 sample3 median
            AX-1   NA       120     130  125    
            AX-2   NA       NA     NA  NA
            AX-3   NA       NA     196  196'
df <- read.table(text=df, header=T)

Run Code Online (Sandbox Code Playgroud)

这是我的预期输出:

df <- 'pr_id  sample1  sample2 sample3
            AX-1   NA       125     125    
            AX-2   NA       NA     NA
            AX-3   NA       NA     196'
df <- read.table(text=df, header=T)

Run Code Online (Sandbox Code Playgroud)

有什么想法实现这一目标？

replace r na

use*_*870

lucky-day

2
推荐指数

3
解决办法

74
查看次数