我开始将多重处理纳入我的代码中,因为我试图自动化的任务从计算角度来说相当昂贵。根据我收集的 stackoverflow 信息,我的代码中的模块结构如下。我正在 Win10 中开发 python 3.7。
\nmain:除了加载输入等之外,还调用多处理函数的地方。
\nimport pandas as pd\nimport run\n\ndef do():\n df=pd.DataFrame({'Identifier': ['id_1', 'id_1', 'id_1', 'id_1', 'id_1', 'id_2', 'id_2', 'id_2', 'id_2', 'id_2', 'id_3', 'id_3', 'id_3', 'id_3', 'id_3'],\n 'float_id': [1, 2, 3, 4, 5, 10, 25, 33, 45, 50, .1, .2, .3, .4, .5],\n 'a': np.random.rand(15),\n 'b': np.random.rand(15),\n 'c': np.random.rand(15)})\n \n v_column=['a', 'b', 'c']\n \n df_out=run.function_multiprocessing(df, v_column)\n\n return df_out\n\nif __name__=='__main__':\n df_out=do()\n
Run Code Online (Sandbox Code Playgroud)\nimport defs\nimport pandas as pd\n\nimport multiprocessing\n\n\ndef iterator(data, id_col, …
Run Code Online (Sandbox Code Playgroud)