hadoop 三种运行方式

一、本地运行方式

1 创建在hadoop-3.3.5文件下面创建一个wcinput文件夹

[antares@hadoop1 hadoop-3.3.5]$ mkdir wcinput

[antares@hadoop1 hadoop-3.3.5]$ cd wcinput

[antares@hadoop1 wcinput]$ vim word.txt

内容可以随便写即可:(比如编写如下内容)

启动: systemctl start docker
停止: systemctl stop docker
重启: systemctl restart docker
查看: systemctl status docker
开机: systemctl enable docker

2 回到Hadoop目录/opt/module/hadoop-3.3.5 执行程序如下

[antares@hadoop1 hadoop-3.3.5]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5.jar wordcount wcinput wcoutput

注意:wcoutput ---这个是在命令运行过程中新生成的,不可提前建立该文件

3 查看执行后的结果

[antares@hadoop1 hadoop-3.3.5]$ cat wcoutput/part-r-00000
docker  5
enable  1
restart 1
start   1
status  1
stop    1
systemctl       5
停止:  1
启动:  1
开机:  1
查看:  1
重启:  1

 二 、编写集群分发脚本

1 在其中一台虚拟机上创建一个文件

[antares@hadoop1 hadoop-3.3.5]$ vim kang.txt

2 给用户授权并能操作 /opt/module

[antares@hadoop1 hadoop-3.3.5]$ sudo chown antares:antares -R /opt/module

如果本来就是用这个命令登录,那么不需要再进行授权可执行。

3 通过命令进行文件拷贝,拷贝给hadoop 3,需要知道hadoop 3的密码

[antares@hadoop2 hadoop-3.3.5]$ ls
bin  include   lib      LICENSE-binary   LICENSE.txt    NOTICE.txt  sbin   wcinput
etc  kang.txt  libexec  licenses-binary  NOTICE-binary  README.txt  share  wcoutput
[antares@hadoop2 hadoop-3.3.5]$ pwd
/opt/module/hadoop-3.3.5
[antares@hadoop2 hadoop-3.3.5]$ scp -r /opt/module/hadoop-3.3.5/kang.txt      antares@hadoop3:/opt/module/hadoop-3.3.5/
The authenticity of host 'hadoop3 (192.168.193.176)' can't be established.
ECDSA key fingerprint is SHA256:HmeFoPbjR1dLiPcwjnlsYhOq3EiaJirR7H9jcjQnBfU.
ECDSA key fingerprint is MD5:d2:d9:4f:61:0b:5a:65:c1:c0:48:d7:b4:c2:f2:1f:1a.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'hadoop3,192.168.193.176' (ECDSA) to the list of known hosts.
antares@hadoop3's password: 
kang.txt  

 另外一台的操作同样使用上述命令,同意(yes)后再输入password 接口拷贝成功。可登录刚拷贝的虚拟机查看是否已经拷贝成功。

4 制作同步脚本 -rsync远程同步工具 

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。

rsyncscp区别:rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。

rsyncscp区别:rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。

删除hadoop3/opt/module/hadoop-3.3.5/下的  wcinputwcoutput

[antares@hadoop3 hadoop-3.3.5]$ rm -rf wcinput wcoutput

同步hadoop102中的/opt/module/hadoop-3.3.5hadoop103

[antares@hadoop2 module]$ rsync -av hadoop-3.3.5/ antares@hadoop3:/opt/module/hadoop-3.3.5/

相关推荐

  1. hadoop 运行方式

    2024-01-25 07:48:02       55 阅读
  2. SEM优化方式

    2024-01-25 07:48:02       49 阅读
  3. Redis:启动方式

    2024-01-25 07:48:02       30 阅读
  4. Mysql常用的删除方式

    2024-01-25 07:48:02       50 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-25 07:48:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-25 07:48:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-25 07:48:02       82 阅读
  4. Python语言-面向对象

    2024-01-25 07:48:02       91 阅读

热门阅读

  1. centos下安装mongo C & C++ 驱动

    2024-01-25 07:48:02       56 阅读
  2. MATLAB Fundamentals>>>Fill Missing Values

    2024-01-25 07:48:02       59 阅读
  3. 常用的gpt-4 prompt words收集6

    2024-01-25 07:48:02       42 阅读
  4. 嵌入式Linux:如何进行嵌入式Linux开发?

    2024-01-25 07:48:02       54 阅读
  5. ORACLE数据导出工具

    2024-01-25 07:48:02       46 阅读
  6. TestNG @AfterClass 注解

    2024-01-25 07:48:02       50 阅读
  7. wy的leetcode刷题记录_Day76

    2024-01-25 07:48:02       58 阅读
  8. Leetcode刷题(二十九)

    2024-01-25 07:48:02       59 阅读
  9. toggle封装

    2024-01-25 07:48:02       63 阅读
  10. SpringBoot-SpringBoot自动配置底层源码解析

    2024-01-25 07:48:02       44 阅读
  11. 使用django-admin来做erp,是否需要使用缓存数据库

    2024-01-25 07:48:02       57 阅读