Spark---环境搭建---入门概念

目录

环境搭建


测试

Apache Spark是用于大规模数据处理的统一分析引擎

spark 仅仅替代了hadoop的mapraduce;

spark比hadoop快一百倍;

环境搭建

1:解压;

2:配置spark环境变量:

vim /etc/profile
export SPARK_HOME=/opt/module/spark
export PYSPARK_PYTHON=/opt/module/anacond3/envs/pyspark/bin/python3.8
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop


export PATH=$PATH:$SPARK_HOME/bin

source /etc/profile

 编辑:

vim ~/.bashrc
export JAVA_HOME=/opt/module/jdk
export PYSPARK_PYTHON=/opt/module/anacond3/envs/pyspark/bin

 测试:

spark-submit --version

3:设置spark,yarn是hadoop的一部分,必须启动hadoop时才会运行,spark中配置的和hadoop有关的;

cp spark-env.sh.template spark-env.sh

HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop

 4:测试spark:

完成on yarn 相关配置,使用spark on yarn 的模式提交$SPARK_HOME/examples/jars/spark-examples_2.12.3.11.jar

运行的主类为org.apache.spark.examples.SparkPi

运行命令为:

spark-submit --master yarn --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/spark-examples_2.12-3.1.1.jar

yarn 需要配置:

yarn-site.xml:

<property>
<name>yarn.nodemanager.pmem-check-enabled</name>
<value>false</value>
</property>
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>

hadoop必须启动!

如果提示safe mode问题需要执行:

hadoop dfsadmin -safemode leave

相关推荐

  1. docker本地spark yarn hive环境

    2024-02-19 05:48:02       31 阅读
  2. 详解 Spark 各种运行环境

    2024-02-19 05:48:02       22 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-19 05:48:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-19 05:48:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-02-19 05:48:02       82 阅读
  4. Python语言-面向对象

    2024-02-19 05:48:02       91 阅读

热门阅读

  1. DP进阶之最长递增子序列

    2024-02-19 05:48:02       62 阅读
  2. 【npm】npm镜像源及命令

    2024-02-19 05:48:02       50 阅读
  3. opencv进行人脸识别

    2024-02-19 05:48:02       48 阅读
  4. 企业面临的网络安全风险及应对策略

    2024-02-19 05:48:02       43 阅读
  5. 洛谷 P8630 [蓝桥杯 2015 国 B] 密文搜索

    2024-02-19 05:48:02       43 阅读
  6. npm详解:掌握package.json配置

    2024-02-19 05:48:02       50 阅读
  7. js-后端返回参数前端动态切换样式

    2024-02-19 05:48:02       43 阅读
  8. Python函数——函数介绍

    2024-02-19 05:48:02       55 阅读
  9. 不同编程网站应当注意的点

    2024-02-19 05:48:02       52 阅读
  10. C++入门

    C++入门

    2024-02-19 05:48:02      44 阅读
  11. 从零开始学HCIA之广域网技术01

    2024-02-19 05:48:02       45 阅读
  12. Deep深度系统下载安装Beyond compare4

    2024-02-19 05:48:02       56 阅读