修改云主机配置 - 内存增容

一、修改云主机配置缘由

  • 在今天的Spark课程中,我们深入学习了数据集和数据帧的操作方法。然而,我注意到云主机的内存几乎被耗尽,这导致了系统运行时的卡顿,有时甚至会导致Spark Shell的强制退出。为了确保课程的顺利进行,我需要对云主机的配置进行调整,特别是增加内存容量,以满足我们学习过程中对计算资源的需求。

二、修改云主机配置步骤

1、查看云主机概述

  • 内存使用情况:20GB用了12GB
    在这里插入图片描述

2、查看master云主机

  • 云主机类型 - m1.medium
    在这里插入图片描述

3、更改master云主机配置

  • 更多 ⟶ \longrightarrow 配置变更 ⟶ \longrightarrow 修改配置
    在这里插入图片描述
  • 选择云主机类型 - m1.vlarge - 内存8GB
    在这里插入图片描述
  • 勾选同意强制关机复选框,单击【确定】按钮,正在修改 - 配置/迁移
    在这里插入图片描述
  • 确认修改配置/迁移
    在这里插入图片描述
  • 弹出消息框要求用户确认
    在这里插入图片描述
  • 单击【确定】按钮
    在这里插入图片描述

4、查看master云主机

  • 云主机类型已成功改成m1.vlarge,8GB运行内存,正常运行中……
    在这里插入图片描述

三、使用Spark Shell玩Saprk SQL

1、启动HDFS服务

  • 执行命令:start-dfs.sh
    在这里插入图片描述

2、启动Spark集群

  • 执行命令:start-all.sh
    在这里插入图片描述

3、启动集群模式Spark Shell

  • 执行命令:spark-shell --master spark://master:7077
    在这里插入图片描述

4、读取文件生成单例数据帧

  • 执行命令:val df = spark.read.text("hdfs://master:9000/student/input/student.txt")
    在这里插入图片描述

  • 执行命令:df.show
    在这里插入图片描述

5、将单列数据帧转换成多列数据帧

val stuDF = df
  .withColumn("id", split(col("value"), ",")(0).cast("int"))
  .withColumn("name", split(col("value"), ",")(1))
  .withColumn("gender", split(col("value"), ",")(2))
  .withColumn("age", split(col("value"), ",")(3).cast("int"))
  .drop("value") // 删除原始的 value 列
  • 执行上述命令
    在这里插入图片描述

  • 执行命令:stuDF.printSchema
    在这里插入图片描述

  • 执行命令:stuDF.show
    在这里插入图片描述

6、基于数据帧生成临时视图

  • 执行命令:stuDF.createOrReplaceTempView("student")
    在这里插入图片描述

7、基于临时视图进行SQL查询

  • 执行命令:spark.sql("select * from student where gender = '女' and age > 20").show
    在这里插入图片描述

相关推荐

  1. 自动化脚本:快速修改Linux主机IP地址配置

    2024-06-13 06:04:03       15 阅读
  2. nacos增加修改配置实时生效

    2024-06-13 06:04:03       7 阅读
  3. ubuntu 如何修改主机名称

    2024-06-13 06:04:03       30 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-13 06:04:03       10 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-13 06:04:03       12 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-13 06:04:03       11 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-13 06:04:03       13 阅读

热门阅读

  1. 华为AR路由器配置防攻击策略

    2024-06-13 06:04:03       5 阅读
  2. kotlin 语法糖

    2024-06-13 06:04:03       6 阅读
  3. Web前端后端结合:深度解析与实战策略

    2024-06-13 06:04:03       4 阅读
  4. 字节跳动基础架构两篇论文入选 VLDB 2024

    2024-06-13 06:04:03       4 阅读
  5. payable介绍, 编写一个转账的测试合约

    2024-06-13 06:04:03       5 阅读
  6. git 常用命令

    2024-06-13 06:04:03       4 阅读
  7. 理解 Vue 中的响应式系统

    2024-06-13 06:04:03       4 阅读
  8. Springer投稿流程——Cybersecurity

    2024-06-13 06:04:03       7 阅读
  9. debian10 arm芯片安装.net6

    2024-06-13 06:04:03       5 阅读