抱歉,如果这是一个幼稚的问题,但我仍在尝试理解 Snakemake 的复杂性。
我有一个目录,其中包含许多我想要并行应用规则的文件(即我想要向集群提交相同的脚本,为每次提交指定不同的输入文件)。
我第一次尝试使用 Expand 作为输入文件,但这只导致了一个作业提交:
CHROMS = [str(c) for c in range(1, 23)] + ["X"]
rule vep:
input:
expand("data/split/chr{chrom}.vcf",
chrom=CHROMS)
output:
expand("data/vep/split/chr{chrom}.ann.vcf",
chrom=CHROMS)
shell:
"vep "
"{input} "
"{output}"
Run Code Online (Sandbox Code Playgroud)
这里有替代方法吗?
谢谢你!
我有一个如下所示的数据框:
genotype DIV3 DIV4 ...
WT 12.4 15.2
WT 35.4 35.3
HET 1.3 1.2
HET 1.5 5.2
Run Code Online (Sandbox Code Playgroud)
我希望能够计算每组的每列的中位数,但我不确定在R中这样做的最佳方法.如果我不必调用基因型,我更愿意这样做,因为这可能不会保留其他数据集的常量.
假设我有一个看起来像这样的数据框:
gene drug log2FC
Ubb Naloxone 0.6375514
Tuba1a Naloxone 0.5827224
Scd1 Naloxone -0.7249997
Ubb Aspirin 0.8000
Tuba1a Aspirin 0.73324
Scd1 Aspirin 0.2497
Ubb Haldol 0.0375
Tuba1a Haldol 0.25824
Scd1 Haldol -0.0249997
Run Code Online (Sandbox Code Playgroud)
是否有一种简单的方法可以为每种独特的药物创建列,所以我留下了这样的内容:
gene Naloxone_log2FC Asirin_Log2FC Haldol_log2FC
Ubb 0.6375514 0.73324 0.0375
Tuba1a ...
Scd1 ...
Thanks!
Run Code Online (Sandbox Code Playgroud)