我正在开发一个 Shiny 应用程序,并且在我进行的过程中,我一直在以随意的方式添加数字和表格。我希望有一个更好的框架,以便我可以在输出进一步发展时灵活地将反应式数字和表格添加到输出中。
目前我一直在使用 tabPanel 和 fluidrow 添加额外的汇总表和第二个图。但是,我很难适应这一点。例如,我目前生成 3 个图,但一次只能绘制 2 个。谁能告诉我修改代码以在同一页面上显示所有三个图(distPlot1、distPlot2、distPlot3)和汇总表的方法吗?理想情况下,将来添加额外的表格和图表会很简单。
先感谢您。
我当前的代码如下。
用户界面
library(reshape2)
library(shiny)
library(ggplot2)
# Define UI for application that draws a histogram
fluidPage(
# Application title
titlePanel("Mutation Probability"),
# Sidebar with a slider input for the number of bins
sidebarLayout(
sidebarPanel(
sliderInput("x", "Probability of mutation (per bp):",
min=1/1000000000000, max=1/1000, value=1/10000000),
sliderInput("y", "Size of region (bp):",
min = 10, max = 10000, value = 1000, step= 100),
sliderInput("z", "Number of samples:",
min = 1, max = …
Run Code Online (Sandbox Code Playgroud) 目前我的R循环(见下文)在每次迭代期间都会覆盖自己.我想将每个循环的结果输出到文本文件中.
更详细:R初学者在这里想知道如何在我的脚本中包含一行,以便将每个文件的平均值计算写入文本文件.这样脚本就会创建一个新的空文本文件,然后每次脚本计算文件中第4列的平均值时,该值将输出到文本文件中的一行,该文件包含column1中文件的名称和平均值in第2栏.感谢您的帮助!
filename <- system("ls /dir/",intern=TRUE)
for(i in 1:length(filename)){
file <- read.table(filename[i],header=FALSE) ## if you have headers in your files ##
mean <- mean(as.numeric(file$V4))
}
Run Code Online (Sandbox Code Playgroud) 我有一个与样本相关的观察列表.我想删除特定样本对中出现的相同观察结果.
数据示例:
sample observation
sample1A 5
sample1B 7
sample2A 10
sample2B 10
sample3A 10
sample3B 5
Run Code Online (Sandbox Code Playgroud)
因此,想法是基于字母A和B将样本分组成对,然后对于这些对中的每一对,移除具有匹配观察的任何行.
在上述情况下,仅排除样品2A和样品2B的观察结果,因为它们来自相同的样品,样品2,在两个不同的场合取样(样品2A和样品2B).输出看起来像:
sample observation
sample1A 5
sample1B 7
sample3A 10
sample3B 5
Run Code Online (Sandbox Code Playgroud)
如果可以使用DPLYR这样做是非常有用的,因为我正在努力提高我的熟练程度.
我想使用group_by()根据样本名称将数据分组,然后使用filter()可以工作,但我不知道如何处理基于正则表达式或字符串的第一次配对的嵌套条件,然后过滤通过查找行之间的匹配值.
在此先感谢您的帮助.
初学者在这里试图让管道在bash中运行.如果有人能看出为什么当我运行以下内容时,我会得到:
-bash: `$i': not a valid identifier,
Run Code Online (Sandbox Code Playgroud)
这将是非常有帮助的.如果还有其他错误,请告诉我
for $i in /home/regionstextfile; do tabix /sequences/human_variation/snps/genotypes.vcf.gz $i | vcftools --window-pi 10000 >> /home/Testgenomesdata/genomesregions.txt; done
Run Code Online (Sandbox Code Playgroud)
这个想法是针对regionstextfile(包含基因组坐标)中的每一行运行一个tabix
在vcf.bz
文件中调用的程序,然后使用vcftools
指定选项运行输出,然后将所有输出放入genomesregions.txt
文件中.
我从包含许多值列表的文件中提取样例,例如:
312313.34
243444
12334.92
321312
353532
Run Code Online (Sandbox Code Playgroud)
并使用R从该列表中随机抽样:
list = read.table("data")
out <-sample(list,50,replace=TRUE)
out.mean<-mean(out)
out.mean
Run Code Online (Sandbox Code Playgroud)
有人可以告诉我如何把它放到一个循环中,这样我就可以执行1000次这个程序并取1000的平均值意味着这会产生吗?
非常感谢你提前!
Rubal
我有一个包含多个数据列的制表符分隔文本文件.我想将每列中的值转换为z分数,以便我可以更好地比较每列中的分布.有谁知道快速的方法吗?我一直在学习R并认为R可能有一种有效的方法来做到这一点,但任何解决方案都是受欢迎的.我希望明天使用z分数为演示文稿制作一些数字,因此速度至关重要.
表格示例:
CHROM BIN_START BIN_END N_VARIANTS dataset1 dataset2 dataset3 dataset4 dataset5 dataset6 dataset7
chr1 1 500000 3881 0.0287298 0.0527506 0.0306643 0 0 0.12356 0
chr1 500001 1000000 3370 0.026538 0 0 0 0 0.0887265 0
chr1 1000001 1500000 2851 0.10893 0 0.0391224 0 0 0.0074585 0
chr1 1500001 2000000 3167 0.0612552 0 0 0 0 0.0527309 0
chr1 2000001 2500000 2592 0.154722 0 0.00540119 0 0 0.276087 0
chr1 2500001 3000000 4096 0.0214323 0.0521432 0 0.0505466 …
Run Code Online (Sandbox Code Playgroud) 我想沿着文本文件中的列迭代脚本,但忽略前5列.
目前我的脚本逐行运行一个文本文件来评估第6列中的值.我希望它能够遍历评估第6列,然后是第7列,然后是第8列等的所有行.我不想评估每列脚本读取文件时的每一行,但要遍历整个文件评估列n,然后重复列n + 1
目前我很简单:
for line in Input:
line = line.rstrip()
fields = line.split("\t")
for col in row:
Run Code Online (Sandbox Code Playgroud)
但是我想指定它忽略前5列,因为它们不是目标(但仍然需要作为文件中的信息).
我想类似范围6:20的col的行可能有用,但我是一个python初学者,并且不知道在python中表达这个的正确方法.如果问题太混乱,请告诉我如何澄清这个问题.
预先感谢您的帮助.
最好,
Rubal
Python初学者在这里,我有一个列表列表,并希望引用该列表的特定部分.
例如
lol = [[1, 2, 4], [6, 7, 8], [9, 10, 14]]
Run Code Online (Sandbox Code Playgroud)
如果我只想打印其中一个列表中的第一个项目,例如1,6或9,我该怎么做?
我只能找到单独引用每个列表的方法,例如lol [0],但不能引用该列表中的项目.
预先感谢您的帮助!
干杯
Python初学者在这里。我有一个按列排序的文本文件:
fields = line.split("\t")
Run Code Online (Sandbox Code Playgroud)
我想询问第 3 到 23 列中的任何值是否大于 95。所有列都包含单个浮点数,例如 94.522342 或 99.2321321。到目前为止我所拥有的似乎不起作用:
if (int(fields(3:23)) >= 95):
Run Code Online (Sandbox Code Playgroud)
我认为问题出在 (3:23) 部分,当我试图要求检查每一列时。
非常感谢任何帮助,谢谢!
我正在曼哈顿图中的 R 中绘制数据,对于不同的数据子类别,我有不同的颜色。不幸的是,我想在情节中明确的子类别之一是非常微弱的黄色。有没有办法改变颜色的顺序,以避免该子类别为黄色,或排除黄色?任何一种解决方案都可以。
我目前的命令是这样的:
plot(-log10(1-emp_dis_Fst(xdata[,"MEAN_FST_TAME_AGGRESSIVE"])), col=xdata$CHROM, pch=16)
Run Code Online (Sandbox Code Playgroud)
在此先感谢您的帮助,
鲁巴尔
我有一个数据集,其中记录了 40 个特定基因中是否存在突变,比较了 20 种组织类型的正常组织(例如肺组织)与来自该组织的肿瘤(例如肺肿瘤)。我正在努力寻找可视化这些数据的最佳方法。
数据的一个子集:
Gene Lung_Normal Lung_Cancer Skin_Normal Skin_Cancer Brain_Normal Brain_Cancer
Gene_1 TRUE TRUE TRUE TRUE TRUE TRUE
Gene_2 TRUE TRUE TRUE TRUE TRUE TRUE
Gene_3 FALSE TRUE FALSE FALSE FALSE FALSE
Gene_4 FALSE FALSE FALSE FALSE FALSE FALSE
Gene_5 FALSE TRUE FALSE FALSE FALSE TRUE
Gene_6 FALSE FALSE TRUE TRUE TRUE TRUE
Gene_7 FALSE FALSE FALSE TRUE FALSE FALSE
Gene_8 FALSE FALSE FALSE TRUE FALSE TRUE
Gene_9 FALSE TRUE FALSE FALSE FALSE FALSE
Gene_10 FALSE FALSE FALSE …
Run Code Online (Sandbox Code Playgroud)