小编Sha*_*ver的帖子

创建热图时出错 - 外部函数调用中的NA/NaN/Inf(arg 11)

我正在尝试为我的数据准备热图,但我不知道为什么会出现此错误.

我的数据:

> dput(head(tbl_ready))
structure(c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.370330677123077, 
0, 0, 0, 0, 0, 0.53318856142826, 0, 0, 0, 0, 0, 0.217669675587482, 
0, 0, 0, 0.79337589572453, 0, 1, 0.0132525790616207, 0, 0, 1, 
0.498415470211292, 0.216961707575178, 0.0646831352678839, 0, 
0, 0, 0.778625047514492, 0.165974546372072, 0.076951015613392, 
0.889894091237216, 0, 0, 1, 0.129806153151281, 0.197647497443337, 
1, 0, 0, 0.509023013860118, 0.159412145987791, 0.207873742711735, 
0.749031133231353, 0.222918051830986, 0, 0.741479370384933, 0.133323148299248, 
0.216599753666685, 0.962652293738836, 0.303065152126049, 0, 0.801394522615822, 
0, 0.15864534869139, 0, 0.193050421324826, 0, 0.799048954936309, 
0, 0.328823938175914, 1, …

Run Code Online (Sandbox Code Playgroud)

r nan na gplots

Sha*_*ver

2019 03-16

8
推荐指数

3
解决办法

3万
查看次数

将函数应用于循环中的所有行,并将结果放入新列

我认为标题主要解释了我想要做的事情.由于我对循环不太熟悉,我需要你的帮助.

我有的数据:

> dput(data)
structure(c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 778936.666666667, 
0, 0, 0, 0, 2478666.66666667, 2255834.16666667, 0, 1797065.41666667, 
0, 0, 8091450, 10536461.5079365, 0, 2325600, 0, 0, 0, 1011700, 
2049325, 870025, 0, 0, 0, 892385, 3216538.33333333, 960480, 1024325, 
0, 0, 557780, 5798938.88888889, 846266.666666667, 1183267.5, 
0, 0, 1126786.66666667, 7603630.47619048, 888885, 1771708.33333333, 
0, 0, 1557738.33333333, 5441300, 0, 2007712.33333333, 0, 0, 1792833.33333333, 
3435203.33333333, 1913650, 3339118.93939394, 0, 0, 1047475, 2194228.33333333, 
1248360, 973797.916666667, 671265, 0, 804250, 0, 0, 0, 0, …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

lucky-day

7
推荐指数

1
解决办法

202
查看次数

通过重叠row.names和mean值来合并/组合两个数据集的最有效方法

我想找到最有效的方法来组合两个数据帧并平均具有不同row.names的列中的值.所以,我想从两个数据中取jsut重叠的row.names并将它们合并为一个.列的值应按平均值进行平均值.示例数据:

mtcars <- 
structure(list(mpg = c(21, 21, 22.8, 21.4, 18.7, 18.1, 14.3, 
24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32.4, 
30.4, 33.9, 21.5, 15.5, 15.2, 13.3, 19.2, 27.3, 26, 30.4, 15.8, 
19.7, 15, 21.4), cyl = c(6, 6, 4, 6, 8, 6, 8, 4, 4, 6, 6, 8, 
8, 8, 8, 8, 8, 4, 4, 4, 4, 8, 8, 8, 8, 4, 4, 4, 8, 6, 8, 4), 
    disp = c(160, 160, 108, 258, 360, 225, 360, …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

2015 04-21

7
推荐指数

2
解决办法

738
查看次数

编写一个循环来创建具有不同数据源和标题的ggplot数字

我没有循环经验,但看起来我需要创建一些来正确分析我的数据.你能说明如何在我已经创建的代码上创建一个简单的循环吗？让我们使用循环来获得一些图:

pdf(file = sprintf("complex I analysis", tbl_comp_abu1), paper='A4r')

ggplot(df_tbl_data1_comp1, aes(Size_Range, Abundance, group=factor(Gene_Name))) +
  theme(legend.title=element_blank()) +
  geom_line(aes(color=factor(Gene_Name))) +
  ggtitle("Data1 - complex I")+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

ggplot(df_tbl_data2_comp1, aes(Size_Range, Abundance, group=factor(Gene_Name))) +
  theme(legend.title=element_blank()) +
  geom_line(aes(color=factor(Gene_Name))) +
  ggtitle("Data2 - complex I")+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))


ggplot(df_tbl_data3_comp1, aes(Size_Range, Abundance, group=factor(Gene_Name))) +
  theme(legend.title=element_blank()) +
  geom_line(aes(color=factor(Gene_Name))) +
  ggtitle("Datas3 - complex I")+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

dev.off()

Run Code Online (Sandbox Code Playgroud)

现在的问题是我想要实现的目标.首先,我想要分析10个复合体,这意味着应该创建10个pdf文件,并且该示例显示了复杂的三个不同数据集的图.为了使其正确,变量comp1(from df_tbl_dataX_comp1)中的数字必须从1更改为10 - 取决于我们想要绘制的复数.必须通过循环更改的下一件事是pdf文件的名称和每个图...是否可以编写这样的循环？

数据: …

r ggplot2

Sha*_*ver

2015 10-23

7
推荐指数

1
解决办法

1686
查看次数

将行中的值除以最接近的最大值

我试图将行中的所有值除以最接近的最大值(如果最大值和值之间没有0).究竟是什么意思我会告诉你一个例子:

原始数据:

Name     1st   2nd   3rd   4th   5th  6th  7th   
Gregg     0    30    50    10    0    30    60   
Mike     20    50    30    0     0    2      0
Susane   30    0     10    0    100   30     0   
Marcel    0    40    30    10    0    2      0

Run Code Online (Sandbox Code Playgroud)

到目前为止我写的脚本能够在这样的数据中找到局部最大值.如果该值不是行中最高最大值的至少20%,则忽略最大值.

这是一个输出:

Name     1st   2nd   3rd   4th   5th  6th  7th   
Gregg     0    0      1    0     0    0     1   
Mike      0    1      0    0     0    0     0
Susane    1    0      0    0     1    0     0  
Marcel    0    1      0 …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

lucky-day

6
推荐指数

0
解决办法

281
查看次数

如果fullfiles有两个规则将名称存储在向量中

从数据开始:

> dput(Data1)
structure(list(X1 = structure(c(17L, 14L, 20L, 16L, 1L, 2L, 3L, 
4L, 15L, 8L, 9L, 10L, 11L, 12L, 13L, 21L, 22L, 23L, 18L, 19L, 
5L, 6L, 7L), .Label = c("Astra_1", "Astra_2", "Astra_3", "Astra_4", 
"Audi_1", "Audi_2", "Audi_3", "BMW_1", "BMW_2", "BMW_3", "BMW_4", 
"BMW_5", "Fiat_1", "Mazda_2", "Mercedes_1", "Nexia_1", "Porsche_1", 
"Scania_1", "Scania_2", "Tico_1", "VW_1", "VW_2", "VW_3"), class = "factor"), 
    X2 = structure(c(2L, 3L, 10L, 7L, 8L, 12L, 9L, 14L, 11L, 
    4L, 5L, 6L, 15L, 13L, 4L, 5L, 9L, 14L, 11L, 1L, 3L, 10L, …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

2016 04-14

6
推荐指数

1
解决办法

160
查看次数

从不同数据中分组元素

在我的工作中,我试图找到哪些基因通常在一起.所以我设置了一些实验,现在尝试分析数据.我已经编写了一个很好的脚本来分析它但仍然不够.

我这次要做的是分析几个表并确定哪些基因通常在一起 - 在同一个集群中.

这是我的数据:

第一张表:

    > dput(tbl_col_clu1[1:20,])
structure(list(`10` = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0), `20` = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 0), `52.5` = c(0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0), `81` = c(0, 0, 0, 0, …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

2014 08-06

5
推荐指数

0
解决办法

253
查看次数

从数据框中删除重复的单词

让我们用一个例子:

> dput(data)
structure(list(mpg = c(15.2, 10.4, 13.3, 14.7, 22.8, 15.5, 14.3, 
19.7, 32.4, 27.3, 15.8, 30.4, 21.4, 18.7, 10.4, 30.4, 15, 21, 
21, 22.8, 24.4, 19.2, 17.8, 16.4, 17.3, 15.2, 19.2, 26, 33.9, 
21.5, 18.1, 21.4), cyl = c(8, 8, 8, 8, 4, 8, 8, 6, 4, 4, 8, 4, 
6, 8, 8, 4, 8, 6, 6, 4, 4, 6, 6, 8, 8, 8, 8, 4, 4, 4, 6, 4), 
    disp = c(304, 472, 350, 440, 108, 318, 360, …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

lucky-day

5
推荐指数

1
解决办法

84
查看次数

循环和聚类

我不得不承认这对我来说太难了.我必须分析一些数据,这一步对我来说至关重要.

我要分析的数据:

> dput(tbl_clustering)
structure(list(P1 = structure(c(14L, 14L, 6L, 6L, 6L, 19L, 15L, 
13L, 13L, 13L, 13L, 10L, 10L, 6L, 6L, 10L, 27L, 27L, 27L, 27L, 
27L, 22L, 22L, 22L, 21L, 21L, 21L, 27L, 27L, 27L, 27L, 21L, 21L, 
21L, 28L, 28L, 25L, 25L, 25L, 29L, 29L, 17L, 17L, 17L, 5L, 5L, 
5L, 5L, 20L, 20L, 23L, 23L, 23L, 23L, 7L, 26L, 26L, 24L, 24L, 
24L, 24L, 3L, 3L, 3L, 9L, 8L, 2L, 11L, 11L, 11L, 11L, 11L, 12L, 
12L, …

Run Code Online (Sandbox Code Playgroud)

algorithm r

Sha*_*ver

2016 01-16

5
推荐指数

1
解决办法

242
查看次数

如何根据子集函数从数据框中删除行？

我想从我的数据框中删除一些行.我认为使用subset它将是最简单的方法.

我之前使用以下代码删除了一些行:

data_selected <- subset(tbl_data, Name.x != "XXX" & Name.y != "YYY")

Run Code Online (Sandbox Code Playgroud)

问题是如何从我的表中删除两个单元格(同一行)中具有相同字符串的行.

我认为这mtcars可以作为一个例子:

                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1 …

Run Code Online (Sandbox Code Playgroud)

Sha*_*ver

lucky-day

5
推荐指数

1
解决办法

1万
查看次数