dsi*_*cha 6 python java performance jvm jython
我有一个以下微小的Python方法,它是迄今为止性能热点(根据我的分析器,在这里花费了大约95%的执行时间)在一个更大的程序中:
def topScore(self, seq):
ret = -1e9999
logProbs = self.logProbs # save indirection
l = len(logProbs)
for i in xrange(len(seq) - l + 1):
score = 0.0
for j in xrange(l):
score += logProbs[j][seq[j + i]]
ret = max(ret, score)
return ret
Run Code Online (Sandbox Code Playgroud)
代码是在Python的Jython实现中运行,而不是CPython,如果这很重要的话. seq
是一个DNA序列串,大约有1,000个元素. logProbs
是一个词典列表,每个位置一个.目标是找到任何长度l
(大约10-20个元素)的子序列的最大分数seq
.
我意识到所有这些循环由于解释开销而效率低下,并且在静态编译/ JIT语言中会更快.但是,我不愿意切换语言.首先,我需要一个JVM语言用于我正在使用的库,这种约束我的选择.其次,我不想将此代码批量转换为较低级别的JVM语言.但是,如果有必要,我愿意用其他东西重写这个热点,虽然我不知道如何连接它或者开销是多少.
除了这种方法的单线程缓慢之外,我还无法让程序在并行化方面超过4个CPU.鉴于它几乎所有的时间都花在我发布的10行热点上,我无法弄清楚这里的瓶颈是什么.
归档时间: |
|
查看次数: |
473 次 |
最近记录: |