集群节点状态异常的解决方式

在这里插入图片描述
在这里插入图片描述

集群节点状态异常的解决方式

问题概述

集群的主要架构是有两个主节点(master01、master02)和一个工作节点(worker01)的Hadoop高可用集群,在过了较长时间重启后,发现主节点的状态都为Standby,不存在Active的节点。

解决方式

具体的统一调用脚本可以看我的另一篇博客集群管理脚本中有统一调用脚本remote_call.sh

1.关闭所有服务
stop-all.sh
2.对所有集群删除Hadoop相关文件
2.1 删除Hadoop系统运行时创建的临时数据和文件

对所有集群中的机器调用(可以使用统一调用脚本)

rm -rf /tmp/hadoop
2.2 删除Hadoop的数据文件

删除安装目录下的Hadoop数据文件

rm -rf /opt/software/hadoop-3.1.3/data/*
3.重新对Hadoop节点进行初始化和启用

启动zk服务

zkServer.sh start

这两个命令需要对集群中的所有机器执行(可以调用统一调用脚本)

# 启动 journalnode 集群
	hdfs --daemon start journalnode # *4
#格式化zkfc
	hdfs zkfc -formatZK

对Master01节点进行格式化。

#主NN节点格式化
	hdfs namenode -format

对另一个主节点执行下列命令

#从NN节点格式化和启动
	ssh root@master02 hdfs namenode -bootstrapStandby
	ssh root@master02 hdfs --daemon start namenode
4.重启服务,检查节点状态

检查Master01节点是否变为Active状态。
在这里插入图片描述

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-13 19:00:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-13 19:00:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-13 19:00:02       58 阅读
  4. Python语言-面向对象

    2024-07-13 19:00:02       69 阅读

热门阅读

  1. 【PLC】基本概念

    2024-07-13 19:00:02       19 阅读
  2. package.json 脚本配置使用环境文件

    2024-07-13 19:00:02       22 阅读
  3. ADC分类

    2024-07-13 19:00:02       19 阅读
  4. Linq的常用方法

    2024-07-13 19:00:02       22 阅读
  5. 数据湖仓一体(四)安装hive

    2024-07-13 19:00:02       19 阅读
  6. 简单的网页压力测试

    2024-07-13 19:00:02       20 阅读
  7. 「UCD」浅谈蓝湖Figma交互设计对齐

    2024-07-13 19:00:02       19 阅读
  8. Log4j的原理及应用详解(四)

    2024-07-13 19:00:02       22 阅读