我必须写一份文件,说明书非常严格.所有数字(轴标签,刻度标签,图例)内的文字大小必须为7pt.由于某些原因,我使用基本图形包,不能使用额外的包,如ggplot2.在"graphics"(?par)的选项中,我只看到此cex参数和派生词允许相对于默认大小修复文本大小.
R graphics的默认字体大小是多少?
试运行是工作流语言的一个非常重要的功能。我所看到的主要是运行命令时将执行的内容,这正是运行时看到的内容make -n。
然而类比功能snakemake -n打印出类似的东西
Building DAG of jobs...
rule produce_output:
output: my_output
jobid: 0
wildcards: var=something
Job counts:
count jobs
1 produce_output
1
Run Code Online (Sandbox Code Playgroud)
日志包含除执行的命令之外的所有内容。有没有办法从snakemake获取命令?
我之前在LSF集群上使用过snakemake,一切都工作得很好。然而,最近我迁移到 SGE 集群,当我尝试使用多个通配符运行一项作业时,出现了一个非常奇怪的错误。
当我尝试根据此规则提交作业时
rule download_reads :
threads : 1
output : "data/{sp}/raw_reads/{accesion}_1.fastq.gz"
shell : "scripts/download_reads.sh {wildcards.sp} {wildcards.accesion} data/{wildcards.sp}/raw_reads/{wildcards.accesion}"
Run Code Online (Sandbox Code Playgroud)
我收到以下错误(snakemake_clust.sh详细信息如下)
./snakemake_clust.sh data/Ecol1/raw_reads/SRA123456_1.fastq.gz
Building DAG of jobs...
Using shell: /bin/bash
Provided cluster nodes: 10
Job counts:
count jobs
1 download_reads
1
[Thu Jul 30 12:08:57 2020]
rule download_reads:
output: data/Ecol1/raw_reads/SRA123456_1.fastq.gz
jobid: 0
wildcards: sp=Ecol1, accesion=SRA123456
scripts/download_reads.sh Ecol1 SRA123456 data/Ecol1/raw_reads/SRA123456
Unable to run job: ERROR! two files are specified for the same host
ERROR! two files are specified for the …Run Code Online (Sandbox Code Playgroud) 有没有一种优雅的方法可以将外部文件中的表包含在 GitHub 呈现的 Markdown 文档中?
我能想到的不优雅的解决方案:
只是做一些解释。我在我的 git 存储库(由 GitHub 托管)中使用一组README.md文件,因此在线浏览存储库非常清晰,因为 GitHub 会自动渲染README.md每个子目录中的文件。
我正在通过算法生成应包含在这些文档中的汇总表。如果可以从外部文件读取该表,那就更优雅了,因为我不想编写README.md直接修改文件的脚本。
我正在处理一个大型BLAST文件和一个大型FASTA文件,我需要为一个BLAST块加载几行FASTA(假设它是一行).
我希望在BLAST的第二个循环(行)中,它将继续在最后处理的FASTA行的下一行,但它正在加载所有相同的FASTA行.为什么?我怎样才能加载下一行?是否真的有必要添加一些索引?
with open(fastaname,'r') as fastafile:
with open(blastfilename,'r') as blastfile:
for line in blastfile:
while True:
fastaline = fastafile.readline()[:-1]
if fastaline[0]=='>':
break
fastaseq += fastaline
somefunction(line,fastaseq)
Run Code Online (Sandbox Code Playgroud)
FASTA有典型的格式:
>name_of_seqence\n
ACGATCATCGTAGCTGCATGACTGCA\n
GATCGATCTGATCGATGCAGTCAGTA\n
>name_of_seqence\n
GCACGCGACCACGATCATTGACTGCA\n
CAAAAGATCTGATCGATGCAGTCAGT\n
CAGTCGATGCTAGTCGATGCTCGATA\n
etc.
Run Code Online (Sandbox Code Playgroud)
我需要每个序列用于下一个BLAST序列的每一行.