Kubernetes作业和退避限制值:该值是重试次数还是分钟数?

德里克

我正在阅读有关作业和重试的Kubernetes文档我找到了这个:

在某些情况下,由于配置中的逻辑错误等原因,您需要在重试一定次数后使作业失败。为此,请设置.spec.backoffLimit以指定重试次数,然后再将作业视为失败。默认情况下,将退避限制设置为6。与作业相关联的失败Pod由Job控制器重​​新创建,且其指数退避延迟(10s,20s,40s…)限制为六分钟。如果在作业的下一个状态检查之前未出现新的失败Pod,则会重置退避计数。

关于以上引用,我有两个问题:

  1. 回退限制值是分钟还是重试次数?在文档示例中使用值6(六)是令人困惑的,因为他最初确认该值是重试次数,但此后说“在6分钟内封顶”。
  2. 有没有一种方法可以定义退避延迟时间?据我了解,此行为(10s,20s,40s…)是默认行为,无法更改。
舒迪帕·夏尔马

.spec.backoffLimit重试次数没有引起混淆

Job控制器以指数延迟(10s,20s,40s,...,360s)重新创建失败的Pod(与Job关联)。当然,此延迟时间由作业控制器设置。

  • 如果Pod失败,则10秒后将创建新的Pod
  • 如果再次失败,则20秒后将创建一个新的
  • 如果再次失败,四十多秒之后
  • 如果再次失败,则下一个在80s(1m 20s)之后
  • 如果再次失败,下一个在160s(2m 40s)之后
  • 如果再次失败,则在320s(5m 20s)之后,会出现新的Pod
  • 如果再次失败,则在360s(而不是640s,因为它大于360s或6m)之后,您将看到下一个

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章