在python中迭代函数参数时，如何使用多处理并行运行函数？

马龙·特谢拉（Marlon Teixeira）

我有一个任意函数，假设它的参数是一个文件func(file(i))。假设我有不同的目录folder_id1, folder_id2, ..., folder_idn。每个目录中都有一定数量的files(i)，例如，在folder_id2内部有文件file(1), file(2), file(3)-三个文件-每个目录具有不同数量的文件。

我想使用并行为func(file(i))每个file(i)特定文件夹内的函数运行该函数multiprocessing。所以会是这样的：

def runInParallel(funcs):
  proc = []
  for func in funcs:
    p = Process(target=func)
    p.start()
    proc.append(p)
  for p in proc:
    p.join()


def foo(folder_id(i)):
    runInParallel(func(file(1)), func(file(2)), ..., func(file(n)))

但是，我不知道如何同时将所有函数设置为functionfunc(file(i))的参数runInParallel()。一种选择是遍历Folderfile(n)内的文件folder_id(i)，但随后不会并行运行。

任何想法？Locals()？

谢谢

编辑：

def interface(id, number):
    directory_name = f"{str(id)}_site_{str(number)}"


    relative_path = os.getcwd()

    file_path = os.path.join(relative_path, "output")
    output_directory = os.path.join(file_path, directory_name)
    os.chdir(output_directory)
    df = np.load('Principal.npy')
    print(df.shape)

    model_directory = os.path.join(relative_path, "modelos", directory_name)
    paths = [os.path.join(model_directory, filename) for filename in os.listdir(model_directory)]
    file_path = [path for path in paths if os.path.isfile(path)]


    f.runInparallel(paths, tms.desagregadorLSTM(, df=df))

Shubham Sharma

一种方法是获取给定文件中存在的所有文件的完整路径folder_id(i)。然后，您可以将此file_paths和传递func给runInParallel，然后将该func应用于每个文件并行。。您还必须修改func函数，使其可以file_path作为参数。这是有助于完成此任务的代码，

import os
from multiprocessing import Process

def runInParallel(file_paths, func):
    proc = []
    for path in file_paths:
        p = Process(target=func, args=(path,))
        p.start()
        proc.append(p)

    for p in proc:
        p.join()


def foo(folder_id):
    paths = [os.path.join(folder_id, filename) for filename in os.listdir(folder_id)]
    file_paths = [path for path in paths if os.path.isfile(path)]

    runInParallel(file_paths, func)

或者，除了使用Process您可以使用它multiprocessing.Pool来简化此任务之外，

def runInParallel(file_paths, func):
    with Pool() as pool:
        results = pool.map(func, file_paths)

更新（根据您的评论）：

如果modelo是文件对象，则将您的desagregadorLSTM方法更新为

def desagregadorLSTM(path, df, medicoes=96): 
    with open(path, "r") as modelo:
        model = load_model(modelo) 
        model.summary() 
        df = df 
        X, y = f.separar_interface(df, n_steps=40)
        X = X.reshape(X.shape[0], 2, 20, X.shape[2]) 
        y = y.reshape(y.shape[0], 40, 1) 
        test_predictions = model.predict(X).flatten() 
        y = y.flatten()

电话，

runInParallel(file_paths, tms.desagregadorLSTM)

Alo更新，

p = Process(target=func, args=(path, df), kwargs={"medicoes": 96 })

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-23

我来说两句

0 条评论

登录后参与评论

上一篇：使用Swift 5.2的memset

TOP 榜单

文章

在python中迭代函数参数时，如何使用多处理并行运行函数？

在python中迭代函数参数时，如何使用多处理并行运行函数？

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u