小编bde*_*vil的帖子

并行化snakemake规则

抱歉，如果这是一个幼稚的问题，但我仍在尝试理解 Snakemake 的复杂性。

我有一个目录，其中包含许多我想要并行应用规则的文件（即我想要向集群提交相同的脚本，为每次提交指定不同的输入文件）。

我第一次尝试使用 Expand 作为输入文件，但这只导致了一个作业提交：

CHROMS = [str(c) for c in range(1, 23)] + ["X"]
rule vep:
    input:
        expand("data/split/chr{chrom}.vcf", 
               chrom=CHROMS)
    output:
        expand("data/vep/split/chr{chrom}.ann.vcf",
               chrom=CHROMS)
    shell:
        "vep "
        "{input} "
        "{output}"

Run Code Online (Sandbox Code Playgroud)

这里有替代方法吗？

谢谢你！

python snakemake

bde*_*vil

lucky-day

4
推荐指数

1
解决办法

1561
查看次数

计算每列分组数据的中位数

我有一个如下所示的数据框:

 genotype     DIV3     DIV4 ...
 WT           12.4     15.2
 WT           35.4     35.3
 HET          1.3      1.2
 HET          1.5      5.2

Run Code Online (Sandbox Code Playgroud)

我希望能够计算每组的每列的中位数,但我不确定在R中这样做的最佳方法.如果我不必调用基因型,我更愿意这样做,因为这可能不会保留其他数据集的常量.

r stat

bde*_*vil

lucky-day

2
推荐指数

1
解决办法

2864
查看次数

将数据框列拆分为多列

假设我有一个看起来像这样的数据框：

gene    drug    log2FC
Ubb    Naloxone    0.6375514
Tuba1a   Naloxone    0.5827224
Scd1    Naloxone    -0.7249997
Ubb    Aspirin    0.8000
Tuba1a    Aspirin  0.73324
Scd1    Aspirin    0.2497
Ubb    Haldol    0.0375
Tuba1a    Haldol    0.25824
Scd1    Haldol    -0.0249997

Run Code Online (Sandbox Code Playgroud)

是否有一种简单的方法可以为每种独特的药物创建列，所以我留下了这样的内容：

gene    Naloxone_log2FC    Asirin_Log2FC    Haldol_log2FC
Ubb     0.6375514    0.73324    0.0375
Tuba1a  ...
Scd1    ...

Thanks!

Run Code Online (Sandbox Code Playgroud)

r dataframe tidyverse

bde*_*vil

lucky-day

0
推荐指数

1
解决办法

42
查看次数

标签统计

r ×2

dataframe ×1

python ×1

snakemake ×1

stat ×1

tidyverse ×1

并行化snakemake规则

计算每列分组数据的中位数

将数据框列拆分为多列

标签 统计

小编bde_vil的帖子

标签统计