小编bde*_*vil的帖子

并行化snakemake规则

抱歉,如果这是一个幼稚的问题,但我仍在尝试理解 Snakemake 的复杂性。

我有一个目录,其中包含许多我想要并行应用规则的文件(即我想要向集群提交相同的脚本,为每次提交指定不同的输入文件)。

我第一次尝试使用 Expand 作为输入文件,但这只导致了一个作业提交:

CHROMS = [str(c) for c in range(1, 23)] + ["X"]
rule vep:
    input:
        expand("data/split/chr{chrom}.vcf", 
               chrom=CHROMS)
    output:
        expand("data/vep/split/chr{chrom}.ann.vcf",
               chrom=CHROMS)
    shell:
        "vep "
        "{input} "
        "{output}"
Run Code Online (Sandbox Code Playgroud)

这里有替代方法吗?

谢谢你!

python snakemake

4
推荐指数
1
解决办法
1561
查看次数

计算每列分组数据的中位数

我有一个如下所示的数据框:

 genotype     DIV3     DIV4 ...
 WT           12.4     15.2
 WT           35.4     35.3
 HET          1.3      1.2
 HET          1.5      5.2
Run Code Online (Sandbox Code Playgroud)

我希望能够计算每组的每列的中位数,但我不确定在R中这样做的最佳方法.如果我不必调用基因型,我更愿意这样做,因为这可能不会保留其他数据集的常量.

r stat

2
推荐指数
1
解决办法
2864
查看次数

将数据框列拆分为多列

假设我有一个看起来像这样的数据框:

gene    drug    log2FC
Ubb    Naloxone    0.6375514
Tuba1a   Naloxone    0.5827224
Scd1    Naloxone    -0.7249997
Ubb    Aspirin    0.8000
Tuba1a    Aspirin  0.73324
Scd1    Aspirin    0.2497
Ubb    Haldol    0.0375
Tuba1a    Haldol    0.25824
Scd1    Haldol    -0.0249997
Run Code Online (Sandbox Code Playgroud)

是否有一种简单的方法可以为每种独特的药物创建列,所以我留下了这样的内容:

gene    Naloxone_log2FC    Asirin_Log2FC    Haldol_log2FC
Ubb     0.6375514    0.73324    0.0375
Tuba1a  ...
Scd1    ...

Thanks!
Run Code Online (Sandbox Code Playgroud)

r dataframe tidyverse

0
推荐指数
1
解决办法
42
查看次数

标签 统计

r ×2

dataframe ×1

python ×1

snakemake ×1

stat ×1

tidyverse ×1