Fra*_*urt 6 python postgresql plpython
我运行完全相同的Python函数,一个作为PostgreSQL PL/Python,另一个作为通常的Python脚本在PostgreSQL之外运行.
令人惊讶的是,当我使用PostgreSQL PL/Python时select * from pymax7(20000);,它平均需要65秒,而当我调用通常的Python脚本时,python myscript.py 20000它平均需要48秒.计算运行查询和脚本10次的平均值.
是否应该有这样的差异?PostgreSQL RDBMS(PL/Python)中的Python如何在性能方面与Python之外的Python进行比较?
我在Ubuntu 12.04 64位上运行PostgreSQL 9.1和Python 2.7.
PostgreSQL PL/Python:
CREATE FUNCTION pymax7 (b integer)
RETURNS float
AS $$
a = 0
for i in range(b):
for ii in range(b):
a = (((i+ii)%100)*149819874987)
return a
$$ LANGUAGE plpythonu;
Run Code Online (Sandbox Code Playgroud)
蟒蛇:
import time
import sys
def pymax7 (b):
a = 0
for i in range(b):
for ii in range(b):
a = (((i+ii)%100)*149819874987) # keeping Python busy
return a
def main():
numIterations = int(sys.argv[1])
start = time.time()
print pymax7(numIterations)
end = time.time()
print "Time elapsed in Python:"
print str((end - start)*1000) + ' ms'
if __name__ == "__main__":
main()
Run Code Online (Sandbox Code Playgroud)
应该没有什么区别。对我来说,你的两个测试用例的运行时间大致相同,均为 53 秒加减 1。
我确实调整了 PL/Python 测试用例以使用与普通 Python 测试用例相同的测量技术:
CREATE FUNCTION pymax7a (b integer)
RETURNS float
AS $$
import time
start = time.time()
a = 0
for i in range(b):
for ii in range(b):
a = (((i+ii)%100)*149819874987)
end = time.time()
plpy.info("Time elapsed in Python: " + str((end - start)*1000) + ' ms')
return a
$$ LANGUAGE plpythonu;
Run Code Online (Sandbox Code Playgroud)
这会告诉您是否涉及任何非 Python 开销。FWIW,对我来说,打印的内容和客户端上 psql 打印的总时间之间的差异始终小于 1 毫秒。
| 归档时间: |
|
| 查看次数: |
1746 次 |
| 最近记录: |