使用ggplot2 geom_tile()+ geom_point()突出显示切片

jwi*_*720 2 statistics r ggplot2

我有以下情节,如下所示:

在此输入图像描述

我正在尝试根据此处的以下代码在另一层中添加点

我导入的数据框如下所示:

residue_id  residue_num per_ddg pg9_seq_bool
A   96  0.00437094862845686 FALSE
A   97  -0.0026333752377897 FALSE
A   98  -0.00453070737795937    FALSE
A   99  -0.0130564560942629 TRUE
A   100 -0.00578979380922636    FALSE
A   101 -0.0128130535970934 FALSE
A   102 -0.0264740211311766 FALSE
A   103 -0.183036342874782  FALSE
A   104 -0.00550669729238368    FALSE
Run Code Online (Sandbox Code Playgroud)

并使用以下代码生成图:

library(ggplot2)
input_ddg <-read.table('per_residue_average.txt',header=T,sep="\t",stringsAsFactors=TRUE)
input_ddg$pg9_seq_bool[input_ddg$pg9_seq == "TRUE"] <- T
input_ddg$pg9_seq_bool[input_ddg$pg9_seq == "FALSE"] <- F


pdf("output.pdf")                                                                                                                                                      
ggplot(input_ddg, aes(residue_id,residue_num,fill=per_ddg) ) +                            
  theme_bw() +                                                                
  geom_tile() +                  
  geom_point(data=input_ddg,aes(size=ifelse(pg9_seq_bool, "dot", "no_dot"))) +
  scale_size_manual(values=c(dot=6,no_dot=NA))+                                                                 
  scale_fill_gradient2(low="blue", mid="white",high="red", midpoint=-.25, na.value="black") +     
  ylab( "Residue Number" ) +                                                  
  xlab( "Mutation Identity")    +     
  scale_y_continuous(breaks=96:125,expand=c(0,0))+
  scale_x_discrete(expand=c(0,0))+
  labs(fill=expression(Delta*Delta*"G(REU)")) +
  ggtitle(expression("Average"~Delta*Delta*"G for Mutations by CDR3 Position")) +
  theme(  panel.background=element_rect(fill="black"), panel.grid.minor=element_blank(), panel.grid.major=element_blank())
dev.off()
Run Code Online (Sandbox Code Playgroud)

我收到一个错误:

Error in grid.Call.graphics(L_setviewport, pvp, TRUE) : 
Non-finite location and/or size for viewport
Calls: print ... lapply -> FUN -> push.vp.viewport -> grid.Call.graphics
In addition: Warning message:
Removed 461 rows containing missing values (geom_point). 
Execution halted
Run Code Online (Sandbox Code Playgroud)

我有一种感觉,因为我使用ifelse解析了TRUE和FALSE,但我完全按照了帖子.

Did*_*rts 5

首先,您不需要在数据框架中用T和F替换TRUE和FALSE值input_ddg.接着,列pg9_seq_bool可以直接在使用aes()geom_point().这将根据TRUE/FALSE值产生两种类型的点.然后scale_size_manual()设置大小0表示FALSE,6表示TRUE.如果不应该在传说出现在这个点的大小再加入争论guide="none"scale_size_maual().

ggplot(input_ddg, aes(residue_id,residue_num,fill=per_ddg) ) +                            
  theme_bw() +                                                                
  geom_tile() +                  
  geom_point(aes(size=pg9_seq_bool)) +
  scale_size_manual(values=c(0,6),guide="none")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述