一、前置安装准备
1、机器
主机名 | ip | 服务 |
---|---|---|
node1 | 192.168.233.100 | NameNode、DataNode、SecondaryNameNode |
node2 | 192.168.233.111 | DataNode |
node3 | 192.168.233.222 | DataNode |
关闭防火墙,关闭selinux
2、java
需要安装java
rz
tar -zxvf jdk-8u381-linux-x64.tar.gz -C /
ln -s /jdk1.8.0_381/ /jdk
# rm jdk-8u381-linux-x64.tar.gz
vim /etc/profile
export JAVA_HOME=/jdk
export PATH=$PATH:$JAVA_HOME/bin
# source /etc/profile
ln -s /jdk/bin/java /usr/bin/java
二、安装Hadoop
rz # 上传hadoop包到机器
tar -zxvf hadoop-3.3.6.tar.gz -C / # 解压到对应目录
ln -s /hadoop-3.3.6/ /hadoop # 创建软连接
# rm -rf hadoop-3.3.6.tar.gz 删除包
[root@localhost hadoop]# ll /hadoop
total 92
drwxr-xr-x. 2 1000 1000 203 Jun 18 2023 bin # 存放hadoop命令
drwxr-xr-x. 3 1000 1000 20 Jun 18 2023 etc # 存放配置文件
drwxr-xr-x. 2 1000 1000 106 Jun 18 2023 include
drwxr-xr-x. 3 1000 1000 20 Jun 18 2023 lib
drwxr-xr-x. 4 1000 1000 4096 Jun 18 2023 libexec
-rw-rw-r--. 1 1000 1000 24276 Jun 13 2023 LICENSE-binary
drwxr-xr-x. 2 1000 1000 4096 Jun 18 2023 licenses-binary
-rw-rw-r--. 1 1000 1000 15217 Jun 9 2023 LICENSE.txt
-rw-rw-r--. 1 1000 1000 29473 Jun 9 2023 NOTICE-binary
-rw-rw-r--. 1 1000 1000 1541 Jun 9 2023 NOTICE.txt
-rw-rw-r--. 1 1000 1000 175 Jun 9 2023 README.txt
drwxr-xr-x. 3 1000 1000 4096 Jun 18 2023 sbin # 管理员程序
drwxr-xr-x. 4 1000 1000 31 Jun 18 2023 share
三、环境配置
均在 /hadoop/etc/hadoop 目录下
1、workers
配置DataNode 从节点,以此告诉集群有多少个节点
vim etc/hadoop/workers
# localhost
192.168.233.100
192.168.233.111
193.168.233.222
2、hadoop-env.sh
配置Hadoop相关环境变量
vim etc/hadoop/hadoop-env.sh
export JAVA_HOME=/jdk
export HADOOP_HOME=/hadoop
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_LOG_DIR=${HADOOP_HOME}/logs
3、core-site.xml
Hadoop 核心配置文件
vim /hadoop/etc/hadoop/core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name> # HDFS文件系统的网络通讯路径
<value>hdfs://192.168.233:8020</value> # 表明datanode将和192.168.233:8020通讯,该配置固定了192.168.233:8020是NameNode进程
</property>
<property>
<name>io.file.buffer.size</name> # io操作文件缓冲区大小,单位是bit
<value>131072</value>
</property>
</configuration>