如何在Python中合并两个IO流？

Codious-JR

我已经围绕Spark-Submit命令创建了一个包装器，以便能够通过解析日志来生成实时事件。目的是创建一个实时界面，显示Spark Job的详细进度。

因此包装器将如下所示：

  submitter = SparkSubmitter()
  submitter.submit('/path/to/spark-code.py')
  for log_event in submitter:
    if log_event:
      print('Event:', log_event)

输出将如下所示：

  Event: StartSparkContextEvent()
  Event: StartWorkEvent()
  Event: FinishWorkEvent()
  Event: StopSparkContextEvent()

在内部，SparkSubmitter类将spark-submit命令作为子进程.Popen进程启动，然后在stdout流上进行迭代，并通过解析由该进程生成的日志来返回事件，如下所示：

  class SparkSubmitter():
    def submit(self, path):
        command = self.build_spark_submit_command(path)
      self.process = Popen(command, stdout=PIPE, stderr=PIPE)

    def __iter__(self):
        return self

    def __next__(self):
        # note: this is a IO-Blocking command
        log = self.process.stdout.readline().decode('utf-8') 
      return self.parse_log_and_return_event(log)

此实现与Spark Standalone集群很好地配合。但是在纱线群集上运行时出现问题。

在“纱线群”中，“火花相关的日志”stderr而不是stdout。因此，我的课程无法解析Spark生成的日志，因为它仅尝试读取stdout。

问题1：是否可以将Popen的stdout和stderr作为单个流读取？

问题2：由于stdout和stderr都是Streams，是否可以合并两个Streams并将它们作为一个读取？

问题3：是否可以将所有日志重定向到仅stdout？

吹牛

的回答您的问题所有3个是肯定的，你可以使用stderr=subprocess.STDOUT作为参数Popen，以输出重定向stderr到stdout：

self.process = Popen(command, stdout=PIPE, stderr=subprocess.STDOUT)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

如何在Python中合并两个json文件？

Python如何在numpy中合并两个矩阵

如何在Python中合并两个元组？

如何在python中合并两个csv文件

如何在python中合并两个列表？

如何在python中合并两个整数列

如何在seaborn python中合并两个relplot？

如何在python中合并两个排序的链表

如何在python中合并两个列表

如何在RxJ中合并两个流以及更多？

如何在ffmpeg中合并两个没有音频流的视频

如何在Python中的单个表达式中合并两个词典（合并词典）？

如何在火花流中减少两个键？

如何在Apache Flink中连接两个流

合并两个流

如何在Python中合并列表中的两个元素

如何在Oracle中合并两个表

如何在TypeScript中合并两个Map

如何在 ReactJS 中合并两个对象数组？

如何在Java中合并两个输入流？

如何在R中合并两个表？

如何在Java中合并两个XML

如何在Java中“合并”两个URI？

如何在R中合并两个列表

如何在angularjs中合并两个对象数组？

如何在Java中合并两个ResultSet？

如何在SQL SERVER中合并两个表？

如何在Splunk中合并两个统计信息？

TOP 榜单

文章

如何在Python中合并两个IO流？

如何在Python中合并两个IO流？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

SQL Server中的非确定性数据类型

如何避免每次重新编译所有文件？

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

HttpClient中的角度变化检测

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

在Wagtail管理员中，如何禁用图像和文档的摘要项？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

构建类似于Jarvis的本地语言应用程序

Camunda-根据分配的组过滤任务列表

如何了解DFT结果

Embers js中的更改侦听器上的组合框

ggplot：对齐多个分面图-所有大小不同的分面

使用分隔符将成对相邻的数组元素相互连接

PHP Curl PUT 在 curl_exec 处停止

您如何通过 Nativescript 中的 Fetch 发出发布请求？

错误：找不到存根。请确保已调用spring-cloud-contract：convert

应用发明者仅从列表中选择一个随机项一次