如何在没有 Spark Rest API 的情况下监听 Spark 中的作业进度

哈希尔·乔克希

我创建了自己的扩展 SparkListener 的 Spark 侦听器类。我已经覆盖了 onJobStart 和 onJobEnd 方法。但是找不到获得工作进展的方法。我想查看已完成作业的百分比。我知道我可以通过 Spark Rest API,但不幸的是我不能使用它。有没有其他方法可以获得工作进度百分比?

伊戈尔·伯曼

每个作业由阶段组成,因此作业开始事件具有 stageInfos。每个阶段都有 numTasks,因此您可能可以计算总共有多少个任务,并且通过监听 onTaskEnd/onStageCompleted,您可以跟踪工作进度。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在spark RDD中没有combineByKey和aggregateByKey的情况下获得指定的输出

如何在不使用spark-submit的情况下将java程序中的spark作业提交到独立的spark集群?

在没有 SSH 的情况下从 Dataproc 集群上的气流触发 spark 提交作业

如何在不运行Apache Spark作业的情况下获取DAG?

如何在没有异常的情况下通过更改的架构从Spark写入Kafka?

如何在没有误解的情况下将日期存储在 Spark 数据集中

如何在没有REST客户端的情况下演示REST API

在没有标题的情况下读取Spark Dataframe中的Hive表

在spark RDD中没有数组数组的情况下正常打印数据

在没有sbt的情况下运行Spark sbt项目?

在没有Spark群集的情况下运行Azure Databricks

如何在没有HTTP的情况下创建类似REST API的“东西”?

WordPress REST API-如何在没有插件的情况下进行身份验证

如何在不更改顺序的情况下逐行读取数据帧?在Spark Scala中

如何在某些情况下从Spark数据框中获取几行

如何在保留最新数据的情况下从Spark数据框中删除重复项?

在某些情况下如何在Spark DataFrame中创建新列“ count”

如何在不爆炸的情况下映射 Spark 数组?

如何在没有数据框的情况下在Spark中执行列表达式

在没有实体ID最佳实践的情况下,在REST API中删除

如何在没有笔记本的情况下从Azure Databricks Spark群集查询数据?

在Java中没有重点的情况下监听输入

使用REST触发Spark作业

在没有 kubectl 的情况下使用 Kubernetes REST API

如何在没有Spring安全性的情况下使用api密钥保护rest api

在不使用 spark.yarn.maxAttempts 参数的情况下控制单个 Spark 作业中的尝试次数

默认情况下,spark是否具有键值对处理?

默认情况下,Spark Dataframe 是如何分区的?

如何在不登录的情况下保护REST API