多处理列表中的多个文件

Chr*_*r W 4 python csv multithreading list multiprocess

我试图读取一个列表,其中包含同步存储在列表中的N个.csv文件.

现在我做以下事情:

导入多进程

  1. 空列表
  2. 使用.cv的listdir附加列表
  3. def A() - 偶数文件(list [:: 2])
  4. def B() - 奇数文件(列表[1 :: 2]
  5. 流程1 def A()
  6. 流程2 def B()

    def read_all_lead_files(folder):
    
        for files in glob.glob(folder+"*.csv"):
            file_list.append(files)
            def read_even():
               file_list[::2]    
            def read_odd():
               file_list[1::2]  
    
         p1 = Process(target=read_even)
         p1.start()
         p2 = Process(target=read_odd)
         p2.start()
    
    Run Code Online (Sandbox Code Playgroud)

有没有更快的方法将列表的分区拆分为Process函数?

Hen*_*ter 6

我猜这里是根据你的要求,因为最初的问题还不清楚.由于os.listdir不保证订购,我假设您的"两个"功能实际上是相同的,您只需要同时对多个文件执行相同的过程.

根据我的经验,最简单的方法是Pool启动a,为每个文件启动一个进程,然后等待.例如

import multiprocessing

def process(file):
    pass # do stuff to a file

p = multiprocessing.Pool()
for f in glob.glob(folder+"*.csv"):
    # launch a process for each file (ish).
    # The result will be approximately one process per CPU core available.
    p.apply_async(process, [f]) 

p.close()
p.join() # Wait for all child processes to close.
Run Code Online (Sandbox Code Playgroud)