ZooKeeper 在网络中断后显示不存在的节点

AJD25

我有一个带有 ZooKeeper 的 3 盒 Solr 云设置,每个服务器都有一个 Solr 和 ZK 安装(我知道并不完美)。一切正常,直到今天早上网络中断。

停电后邮箱 A 和 C 按预期返回。框 B 没有,Solr 服务的重新启动显示了一个错误,指出A previous ephemeral live node still exists. Solr cannot continue.

在 B 节点 ZooKeeperLive_Nodes路径中查看时,即使 Solr 已关闭,Solr 安装也已显示为活动的活动节点。该节点未显示在Live_nodes路径内的框 A 和 B 上我也无法deletermr这个节点,因为 ZooKeeper 告诉它不存在。

我已经尝试过Solr stop -all,以防有我没有看到的隐藏进程,但 Solr 声明没有运行实例。

下一步是在 B 上安装一个新的 ZooKeeper 实例。之后ls /live_nodes继续显示这个不存在的 solr 实例。

任何帮助表示赞赏。谢谢你。

AJD25

仅供参考,我继续进行故障排除并最终重建了所有 3 个 ZooKeeper 节点。这导致我出现一个单独的错误,显示集合碎片已损坏。在对“clusterstate.json”文件进行故障排除后,最终修复的是创建一个具有单独名称的重复集合,然后是用于重定向流量的别名。在此之后,我能够删除损坏的集合。

我认为重复的集合和别名会一直修复它。

希望这对将来的人有所帮助。谢谢。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章