我如何在多处理中同步 list 和 int？

知乎

我有这样的代码：

urls = []
data = []
data_counter = 0


def get_data(url):
    with requests.Session() as session:
        response = session.get(url, params=params).json()

    items = {
        'A': a,
        'B': b,
        'C': c,
        'D': d,
        'E': e
    }
    data.append(items)

    print('DONE №{}: {}'.format(data_counter, url))


if __name__ == "__main__":
    with Pool() as pool:
        for url in urls:
            pool.apply_async(get_data, (url,))
        pool.close()
        pool.join()

get()并且wait()不起作用，因为每个进程依次运行，而不是同时运行。

那么，我应该怎么做才能data包含来自所有进程的数据并counter显示正确的结果？

罗布街

当多处理库为您创建一个新进程时，它会使用一个名为fork. 这会创建一个新进程，该进程仍然可以访问父进程的内存，但是只要任何一方更改任何内容，数据就会首先复制到子进程的内存中。这意味着您对子进程中的变量所做的更改将不会在父进程中可见，这就是为什么data似乎没有更新。

为了得到你想要的东西，你要么需要使用某种形式的共享内存数据结构（查看multiprocessing.Manager和multiprocessing.Value），要么你需要return (data, data_counter)从get_data并执行以下操作以将它们全部合并到父进程：

results = list()
for url in urls:
    results.append(pool.apply_async(get_data, (url,)))
for result in results:
    new_data, new_data_counter = result.get()
    data.extend(new_data)
    global data_counter
    data_counter += new_data_counter

（您还需要确保在开始时data清除并data_counter设置为 0，get_data以避免添加重复项extend并使计数器正常工作。）

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-23

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

我如何在多处理中同步 list 和 int？

我如何在多处理中同步 list 和 int？

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成