我有一个由基本数学函数(abs,cosh,sinh,exp,...)组合定义的函数.
我想知道它是否有所作为(速度)使用,例如,
numpy.abs()而不是abs()?
编辑以澄清输入/输出。我认为无论如何这都会有点慢,但到目前为止我还没有真正考虑过我的 python 脚本的速度,并且我正在尝试找出加速此类操作的方法。
我的输入是基因组序列的腌制字典。我目前正在处理两个基因组,即芽殖酵母基因组(磁盘上 11.5 MB)和人类基因组(磁盘上 2.8 GB)。这些字典的形式如下:
seq_d = { 'chr1' : 'ATCGCTCGCTGCTCGCT', 'chr2' : 'CGATCAGTCATGCATGCAT',
'chr3' : 'ACTCATCATCATCATACTGGC' }
Run Code Online (Sandbox Code Playgroud)
我想找到基因组两条链中核苷酸的所有单碱基实例。其中+strand指的是上述字典中的序列,strand-是序列的反向补集。我的输出是一个嵌套字典,其中顶层keys是+or -,嵌套的keys是染色体名称,值是 0 索引位置的列表:
nts = 'T'
test_d = {'+': {'chr3': [2, 5, 8, 11, 14, 17], 'chr2': [3, 7, 10, 14, 18],
'chr1': [1, 5, 9, 12, 16]}, '-': {'chr3': [0, 4, 7, 10, 13, 15],
'chr2': [2, 5, 9, 13, 17], 'chr1': [0]}}
Run Code Online (Sandbox Code Playgroud)
test_d稍后在脚本中定义一组要在大型 Illumina …