Python-多处理

迪米特里斯

我要完成以下任务：

我有一个“输入” tsv文件：

我想将其转换为以下格式：

我设法使用以下代码做到这一点：（开始是输入文件的第一列，停止是第二列，深度是第三列。）

def parse(i):
    out = []
    start = int(i[0])
    stop = int(i[1])
    depth = i[2]
    times = stop - start
    out += times * [depth]
    return(out)

signal = []
for i in tqdm(file):
    x = parse(i)
    signal.append(x)

with open('output.txt', 'w') as f:
    for item in signal[0]:
        f.write("%s\n" % item)

尽管我的输入文件有16720973行，而且我有许多行，所以我尝试使用以下代码进行并行处理以最大程度地减少执行时间：

def parse(start, stop, depth):
    out = []
    times = int(stop) - int(start)
    out += times * [depth]
    return(out)

signal = []
poolv = multip.Pool(20)
x = [poolv.apply(parse, args=(i[0], i[1], i[2])) for i in tqdm(file)]
signal.append(x)
poolv.close()

但是执行时间没有区别，我认为没有发生多进程。为了减少执行时间，是否有任何错误或更好的方法来解决此问题？

constt

该文档的应用（FUNC [，ARGS [，kwds]]）函数是在说

它会阻塞直到结果准备就绪。给定此块，apply_async（）更适合于并行执行工作。此外，func仅在池的工作程序之一中执行。

这意味着您将依次处理输入文件的各行，以阻塞池，直到其中一个池工作程序产生结果为止。第二件事是，我认为尝试在池工作程序之间拆分输入文件的不同行的处理不会显着提高速度。我会告诉您更多信息，我认为您将花费更多的时间在进程之间来回传输数据，而不是实际节省处理时间，因为这不是一个长时间运行的过程，因此会稍微降低整个过程的速度。工作。

可能值得尝试并行处理多个输入文件，但是考虑到它们通常存储在同一HDD上的事实，这也不会给您带来任何提速。

顺便说一句，如果您觉得这很有用，请按照以下步骤使用bash和进行处理awk：

while read line; do echo $line | awk '{for(i = 0; i < $2 - $1; i++) print $3}'; done < input.txt > output.txt

这是您的input.txt：

这就是您在output.txt文件中得到的：

使用这种方法，您可以在终端中启动一堆作业，并查看它是否可以加快处理多个文件的速度。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：在节点上MySQL vs JSON

Python硒多处理

杀死Python多处理池

Python多处理锁

多处理与线程Python

Python 3.4多处理

多处理和Selenium Python

Python多处理imap

使用多处理的Python

Python多处理模块

Python多处理循环

多处理池：Python

Python多处理：台球与多处理

python多处理的硬件

Python多处理for循环

Python多处理调度

Python多处理For循环

Python多处理变量

Python多处理文档示例

键盘中断与python的多处理

Python多处理池冻结

Python，多处理和GUI

Python多处理IndexError

Python 编程：多处理

python脚本的多处理

正确的 Python 多处理

Python：与多处理混淆

Python 多处理冻结

Python 多处理调试

Python for 循环多处理

TOP 榜单

文章

Python-多处理

Python-多处理

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用