【Hadoop】- YARN概述[6]

目录

一、YARN & Reduce

二、分布式资源调度 - YARN

1、资源调度

2、YARN的资源调度

总结


一、YARN & Reduce

MapReduce是基于YARN运行的,即没有YARN  “无法”  运行MapReduce程序。

二、分布式资源调度 - YARN

YARN(Yet Another Resource Negotiator)是Apache Hadoop生态系统中的一个组件,用于分布式资源调度和作业调度。它是Hadoop的第二代资源管理器,取代了旧版的MapReduce作业调度器。YARN的目标是使Hadoop能够支持更多类型的应用程序,并提供更好的资源管理和作业调度。

1、资源调度

什么是资源调度?我们为什么需要资源调度?

对于资源的利用,有规划、有管理的调度资源使用,是效率最高的方式

2、YARN的资源调度

YARN管控整个集群的资源进行调度,那么应用程序在运行时,就是在YARN的监管(管理)下去运行的。这就像:全部资源都是公司(YARN)的,由公司分配给个人(具体的程序)去使用。

比如,一个具体的MapReduce程序。

假设有一个MapReduce程序,分解了3个Map任务、1个Reduce任务,是如何在YARN的监管下运行的?

向YARN申请使用资源,YARN分配好资源后运行,空闲资源可供其他程序使用

总结

1、YARN是做什么的?

  • YARN是Hadoop的一个组件
  • 用以做集群的资源(内存、CPU等)调度

2、为什么需要资源调度

  • 将资源统一管控进行分配可以提高资源利用率

3、程序如何在YARN内运行

  • 程序向YARN申请所需资源
  • YARN为程序分配所需资源供程序使用

4、MapReduce和YARN的关系

  • YARN用来调度资源给MapReduce分配和管理运行资源
  • 所以,MapReduce需要YARN才能执行

相关推荐

  1. Hadoop YARN组件

    2024-04-22 11:40:05       37 阅读
  2. Hadoop-Yarn-启动篇

    2024-04-22 11:40:05       32 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-22 11:40:05       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-22 11:40:05       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-22 11:40:05       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-22 11:40:05       18 阅读

热门阅读

  1. 三年经验!你还不知道KVM虚拟化技术???

    2024-04-22 11:40:05       11 阅读
  2. python内存泄漏解决

    2024-04-22 11:40:05       12 阅读
  3. 工程师每日刷题-7

    2024-04-22 11:40:05       13 阅读
  4. Vue模版语法(初学Vue之v-指令语法)

    2024-04-22 11:40:05       14 阅读
  5. 什么是 ORM(对象关系映射)

    2024-04-22 11:40:05       14 阅读
  6. web开发

    web开发

    2024-04-22 11:40:05      13 阅读
  7. 【数学建模】建筑工地开工问题

    2024-04-22 11:40:05       13 阅读
  8. 速盾:cdn都能防御哪些攻击?

    2024-04-22 11:40:05       12 阅读
  9. 【每日一题】补档 CF371 D. Vessels | 并查集 | 简单

    2024-04-22 11:40:05       11 阅读
  10. 什么是深度学习?

    2024-04-22 11:40:05       12 阅读