Bad*_*ade 7 python queue file-io multiprocessing
我知道Stack Exchange上有很多关于将多处理结果写入单个文件的帖子,我在阅读了那些帖子之后开发了我的代码.我想要实现的是并行运行'RevMapCoord'函数,并使用multiprocess.queue将其结果写入一个文件中.但是我在排队工作时遇到了问题.我的代码:
def RevMapCoord(list):
"Read a file, Find String and Do something"
def feed(queue, parlist):
for par in parlist:
print ('Echo from Feeder: %s' % (par))
queue.put(par)
print ('**Feeder finished queing**')
def calc(queueIn, queueOut):
print ('Worker function started')
while True:
try:
par = queueIn.get(block = False)
res = RevMapCoord(final_res)
queueOut.put((par,res))
except:
break
def write(queue, fname):
fhandle = open(fname, "w")
while True:
try:
par, res = queue.get(block = False)
print >>fhandle, par, res
except:
break
fhandle.close()
feedProc = Process(target = feed , args = (workerQueue, final_res))
calcProc = [Process(target = calc , args = (workerQueue, writerQueue)) for i in range(nproc)]
writProc = Process(target = write, args = (writerQueue, sco_inp_extend_geno))
feedProc.start()
print ('Feeder is joining')
feedProc.join ()
for p in calcProc:
p.start()
for p in calcProc:
p.join()
writProc.start()
writProc.join ()
Run Code Online (Sandbox Code Playgroud)
当我运行此代码时,脚本停留在"feedProc.start()"步骤.屏幕的最后几行输出行显示"feedProc.start()"末尾的print语句:
Echo from Feeder: >AK779,AT61680,50948-50968,50959,6,0.406808,Ashley,Dayne
Echo from Feeder: >AK832,AT30210,1091-1111,1102,7,0.178616,John,Caine
**Feeder finished queing**
Run Code Online (Sandbox Code Playgroud)
但在执行下一行"feedProc.join()"之前挂起.代码没有错误,继续运行,但什么都不做(挂起).请告诉我我犯了什么错误.
Her*_*nan 11
我认为你应该把你的榜样简化为基础.例如:
from multiprocessing import Process, Queue
def f(q):
q.put('Hello')
q.put('Bye')
q.put(None)
if __name__ == '__main__':
q = Queue()
p = Process(target=f, args=(q,))
p.start()
with open('file.txt', 'w') as fp:
while True:
item = q.get()
print(item)
if item is None:
break
fp.write(item)
p.join()
Run Code Online (Sandbox Code Playgroud)
这里我有两个过程(主要过程,ap).p将字符串放入队列中,由主进程检索.当主进程找到None(我用来表示的标记:"我完成了"它会打破循环.
将其扩展到许多进程(或线程)是微不足道的.
我通过使用 Python3 中的“map_async”函数实现了将多处理结果写入单个文件。这是我写的函数:
def PPResults(module,alist):##Parallel processing
npool = Pool(int(nproc))
res = npool.map_async(module, alist)
results = (res.get())###results returned in form of a list
return results
Run Code Online (Sandbox Code Playgroud)
因此,我为这个函数提供了“a_list”中的参数列表,“module”是一个执行处理并返回结果的函数。上面的函数继续以列表的形式收集结果,并在处理完“a_list”中的所有参数后返回。结果可能不是正确的顺序,但由于顺序对我来说并不重要,所以效果很好。“结果”列表可以迭代,并将各个结果写入文件中,例如:
fh_out = open('./TestResults', 'w')
for i in results:##Write Results from list to file
fh_out.write(i)
Run Code Online (Sandbox Code Playgroud)
为了保持结果的顺序,我们可能需要使用类似于我在问题中提到的“队列”(上面)。虽然我能够修复代码,但我相信不需要在这里提及。
谢谢
AK
| 归档时间: |
|
| 查看次数: |
8678 次 |
| 最近记录: |