小编sha*_*aea的帖子

如何减少anaconda目录中的文件数量?

我正在计算群集上运行conda环境,其中每个"项目"的文件总数受到限制(最多200k个文件).我只创建了几个conda环境(用于Python 2.7的anaconda;在每个环境中安装了~200个python&R包;环境之间的高包重叠)并且已经达到了文件数限制.即使conda clean -a只使用一小部分文件也会被删除.我的conda环境中的一些python包(例如,boost)包含> 10k文件,而clean不会减少这个.

有没有办法大大减少作为conda环境的一部分存储的文件数量?

python r anaconda conda

9
推荐指数
1
解决办法
1233
查看次数

Jupyter笔记本:每个笔记本的内存使用量

由于用户从不关闭旧笔记本电脑,我实验室服务器(Ubuntu)上的内存不断填满.我想更好地了解每个笔记本占用多少内存.我可以总结(粗略)每个用户运行的所有jupyter笔记本的内存使用情况,但我想得到每个笔记本的总内存使用量,以便我可以关闭那些特定的内存生成(或告诉其他用户关闭他/她的失败了.我很快将以下代码放在一起得到约.MEM.每个jupyter内核的使用情况,但我不知道如何将内核ID与特定笔记本关联.

import os
import pwd
import pandas as pd

UID   = 1
EUID  = 2

pids = [pid for pid in os.listdir('/proc') if pid.isdigit()]

df = []
for pid in pids:
    try:
        ret = open(os.path.join('/proc', pid, 'cmdline'), 'rb').read()
    except IOError: # proc has already terminated
        continue

    # jupyter notebook processes
    if len(ret) > 0 and 'share/jupyter/runtime' in ret:
        process = psutil.Process(int(pid))
        mem = process.memory_info()[0] 

        # user name for pid
        for ln in open('/proc/%d/status' % int(pid)):
            if ln.startswith('Uid:'):
                uid = int(ln.split()[UID]) …
Run Code Online (Sandbox Code Playgroud)

jupyter-notebook

8
推荐指数
2
解决办法
8188
查看次数

Snakemake temp() 导致不必要的规则重新运行

我正在使用 Snakemake v 5.4.0,并且遇到了 temp() 的问题。在假设的场景中:

Rule A --> Rule B1 --> Rule C1
     |
      --> Rule B2 --> Rule C2 

where Rule A generates temp() files used by both pathways 1 (B1 + C1) and 2 (B2 + C2).
Run Code Online (Sandbox Code Playgroud)

如果我运行管道,由 RuleA 生成的 temp() 文件将在两个路径中使用后被删除,这正是我所期望的。但是,如果我随后想要重新运行 Pathway 2,则必须重新创建 RuleA 的 temp() 文件,这会触发整个管道的重新运行,而不仅仅是 Pathway2。对于长管道来说,这在计算上变得非常昂贵。除了不使用 之外,还有什么好方法可以防止这种情况发生吗temp()?在我的情况下,这需要很多 TB 的额外硬盘空间?

snakemake

8
推荐指数
1
解决办法
822
查看次数

R phylo对象:如何连接节点标签和节点编号

R 中的 phylo 对象可以具有内部节点标签 ( phylo_obj$node.label),但许多 R 函数使用节点编号而不是节点标签。甚至 phylo 对象本身也使用节点号来描述边(phylo_obj$edge),并且似乎没有内部节点标签到这些用于的节点号的直接映射phylo_obj$edge。如何将节点标签(例如,“NodeA”或“Artiodactyla”)映射到节点编号(例如,250 或 212)?我找不到任何 R 函数,也找不到任何相关文档。

tree r nodes ape phylogeny

5
推荐指数
1
解决办法
4169
查看次数

在闪亮的数据表 Excel 输出中删除标题上方的“标题”行?

在我闪亮的应用程序中,我正在使用:

# server.R
  output$out_table = DT::renderDataTable(
    func_to_creat_dataframe(),
    rownames= FALSE,
    extensions = c('Buttons'),
    options = list(
      pageLength = 96,
      lengthMenu = c(96, 384, 1536),
      dom = 'Blfrtip',
      buttons = c('copy', 'csv', 'excel', 'pdf', 'print')
    )
  )
Run Code Online (Sandbox Code Playgroud)
# UI.R
DT::dataTableOutput('out_table')
Run Code Online (Sandbox Code Playgroud)

...当我使用“Excel”按钮导出表格时,导出的表格在标题行正上方有一个“标题”行。此标题行由一个跨越整个标题的合并单元格组成。我该如何删除这个?此标题行会干扰文件的下游处理,并且完全没有必要,因此我不明白为什么它似乎是数据表文件导出按钮的默认值。

excel r datatables shiny dt

5
推荐指数
1
解决办法
2318
查看次数

标签 统计

r ×3

anaconda ×1

ape ×1

conda ×1

datatables ×1

dt ×1

excel ×1

jupyter-notebook ×1

nodes ×1

phylogeny ×1

python ×1

shiny ×1

snakemake ×1

tree ×1