Spark安装教程

一、前期准备

1.Spark各版本下载地址Index of /dist/spark

2.安装Hadoop(伪分布式):hadoop-2.10.1

3.安装JAVA JDK:JAVA JDK1.8

二、安装Spark(Local模式)

1.解压,移动

sudo tar -zxf spark-3.4.0-bin-without-hadoop.tgz -C /usr/local/
cd /usr/local
sudo mv ./spark-3.4.0-bin-without-hadoop/ ./spark-3.4.0
sudo chown -R qiangzi:qiangzi ./spark-3.4.0    # 此处的 qiangzi 为你的用户名

2.安装后,还需要修改Spark的配置文件spark-env.sh

cd /usr/local/spark-3.4.0
cp ./conf/spark-env.sh.template ./conf/spark-env.sh

3.编辑spark-env.sh文件(vim ./conf/spark-env.sh),在第一行添加以下配置信息:

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

4.配置完成后就可以直接使用,不需要像Hadoop运行启动命令。通过运行Spark自带的示例,验证Spark是否安装成功。

cd /usr/local/spark-3.4.0
bin/run-example SparkPi

5.执行时会输出非常多的运行信息,输出结果不容易找到,可以通过 grep 命令进行过滤(命令中的 2>&1 可以将所有的信息都输出到 stdout 中,否则由于输出日志的性质,还是会输出到屏幕中):

cd /usr/local/spark-3.4.0
bin/run-example SparkPi 2>&1 | grep "Pi is"

三、使用 Spark Shell 编写代码

1.启动Spark Shell

cd /usr/local/spark-3.4.0
bin/spark-shell

四、问题汇总

1.重复安装不同版本的Spark,进入Spark Shell时显示之前安装的spark版本

2.删除之前安装的Spark的目录,不能打开Spark Shell ,出现报错信息

[qiangzi@master spark-2.4.8]$ bin/spark-shell
bin/spark-shell: line 60: /usr/local/spark-3.5.1/bin/spark-submit: No such file or directory

3.使用 vim ~/.bashrc 打开 .bashrc 文件时没有看到和Spark环境变量相关的内容,但使用echo $PATH,显示环境变量为之前Spark版本的环境变量。

4.进入/usr/local/etc/中修改环境变量,依然出现报错。

解决办法:

卸载安装的Spark,重新安装,注意hadoop和spark的版本匹配

相关推荐

  1. Spark安装教程

    2024-05-10 20:02:06       10 阅读
  2. Spark部署详细教程

    2024-05-10 20:02:06       16 阅读
  3. Spark 环境安装

    2024-05-10 20:02:06       37 阅读
  4. spark单机版安装

    2024-05-10 20:02:06       13 阅读
  5. Windows如何安装spark

    2024-05-10 20:02:06       12 阅读
  6. windows安装spark

    2024-05-10 20:02:06       8 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-05-10 20:02:06       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-10 20:02:06       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-10 20:02:06       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-10 20:02:06       18 阅读

热门阅读

  1. LeetCode 每日一题 ---- 【2105. 给植物浇水 II】

    2024-05-10 20:02:06       9 阅读
  2. Redis 源码解析 - Redis 字典与迭代器

    2024-05-10 20:02:06       8 阅读
  3. 【Vue3源码学习】— CH3.5 renderer 详解

    2024-05-10 20:02:06       9 阅读
  4. TypeScript type类型别名

    2024-05-10 20:02:06       10 阅读
  5. Qt QShortcut快捷键类详解

    2024-05-10 20:02:06       10 阅读
  6. 十二届蓝桥杯Python组3月中/高级试题 第二题

    2024-05-10 20:02:06       9 阅读
  7. 智密腾讯云直播组建--准备腾讯云环境

    2024-05-10 20:02:06       9 阅读
  8. html中的整体布局该如何做

    2024-05-10 20:02:06       9 阅读
  9. nginx常用内置变量

    2024-05-10 20:02:06       10 阅读
  10. 在编程中,什么是类的继承?

    2024-05-10 20:02:06       10 阅读
  11. 获取最新的CVE信息

    2024-05-10 20:02:06       9 阅读
  12. 【Redis7】10大数据类型之Bitmap类型

    2024-05-10 20:02:06       8 阅读
  13. 【数据流图】用JointJs实现数据流图(二)

    2024-05-10 20:02:06       10 阅读