我有如下数据,我想替换"." 空间使用gsub()但我无法得到正确的输出.
data<-c("12.57869486" ,"12.57869582" ,"12.57870155")
a<- gsub("."," ", data)
a
[1] " " " " " "
Run Code Online (Sandbox Code Playgroud) 我有一个像下面这样的矢量:
x= c(1,23,4,15,8,17,21)
Run Code Online (Sandbox Code Playgroud)
在向量中的排序值后,我们有:
c(1,4,8,15,17,21,23)
Run Code Online (Sandbox Code Playgroud)
我需要的输出是:
c(3, 3, 4, 2, 2, 2, 2)
Run Code Online (Sandbox Code Playgroud)
其中包含值与其最接近值之间的差异.
但是,如果我想要输出没有排序,有什么解决方案吗?我需要像c(3,2,3,2,4,2,2)这样的输出来知道哪个样本在输出表中具有最大值(这里是第5个值是结果)
我有一个散点图,我想知道如何在置信区间线上方和下方找到基因?
编辑:可重复的例子:
library(ggplot2)
#dummy data
df <- mtcars[,c("mpg","cyl")]
#plot
ggplot(df,aes(mpg,cyl)) +
geom_point() +
geom_smooth()
Run Code Online (Sandbox Code Playgroud)
我有一个巨大的文件(下面是一小部分数据),如下所示,我想绘制一个 PCA,我可以使用 PCA 函数绘制 PCA,但它看起来有点乱,因为我有 200 列,所以我想也许 t- SNE 或 UMAP 效果更好,但我无法使用它们进行绘图。
我想在图中显示列(列名称)之间的关系和聚类。事实上,我从不同的研究中收集了 A、B 和...数据,我喜欢检查它们之间是否存在批次效应。
如果有人能帮助我,我将不胜感激!
DF:
A B C D
1:540450-541070 0.12495878 0.71580434 0.65399319 1.04879290
1:546500-548198 0.41064192 0.26136554 0.11939805 0.28721360
1:566726-567392 0.00000000 0.06663644 0.45661687 0.24408844
1:569158-570283 0.34433086 0.27614141 0.54063437 0.21675053
1:603298-605500 0.07036734 0.42324126 0.23017472 0.29530045
1:667800-669700 0.20388011 0.11678913 0.00000000 0.12833913
1:713575-713660 7.29171225 12.53078648 2.38515165 3.82500941
1:724497-727160 0.40730086 0.26664585 0.45678834 0.12209005
1:729399-731900 0.74345727 0.49685579 0.72956458 0.32499580
Run Code Online (Sandbox Code Playgroud) 我有两个数据框如下,我想比较这些表的值(基于相同的行和列)和指定相同的值与TRUE否则与FALSE.
data1:
id A B C
m1 2 2 2
m2 2 1 2
data2:
id A D B
m1 1 2 2
m2 2 3 2
Output:
id A B
m1 FALSE TRUE
m2 TRUE FALSE
Run Code Online (Sandbox Code Playgroud) 我有一些基因组位置,我想使用biomaRt R包在Ensembl的基础上注释这些位置(查找Ensembl基因ID,外显子,内含子等特征)。
我数据的一部分
chr start stop strand
chr10 100572320 100572373 -
chr10 100572649 100572658 +
Run Code Online (Sandbox Code Playgroud) 我有两个包含三个变量的数据集。我想在世界地图上将其中一个显示为热图,两个显示为饼图。
我使用了下面的代码,但出现了错误。我想知道如何解决它。
library(ggplot2)
library(scatterpie)
world_map <- map_data("world")
df <- data.frame(Country = c("USA", "Canada", "Mexico"),
Cases = c(10, 20, 30))
df_piechart <- data.frame(long = c(-95, -110, -75),
lat = c(37, 60, 20),
size = c(5, 10, 15),
Group1 = c(20, 30, 50),
Group2 = c(30, 40, 30))
ggplot() +
geom_map(dat = world_map, map = world_map, aes(map_id = region), color = "white", fill = "#d3d4d3", linewidth = 0.5, alpha=0.4 ) +
geom_map(dat = df, map = world_map, aes(map_id = Country, fill = …Run Code Online (Sandbox Code Playgroud) r ×7
ggplot2 ×3
statistics ×2
bioconductor ×1
biomart ×1
compare ×1
dataframe ×1
geom-map ×1
gsub ×1
pca ×1
runumap ×1
scatterpie ×1