微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hadoop学习三-YARN

YARN是hadoop的资源调度平台。

1. YARN的基本架构

YARN由以下几个组件组成。Resource ManagerNode ManagerApplication MasterContainer组成。

  1. Resource Manager :RM是一个全局的资源管理器。负责整个系统的资源管理和任务调度。核心组件由两个。调度器Scheduler 和 应用任务管理器ASM(Applications Master)

Scheduler 负责将资源分配给应用程序。ASM 负责启动、监控AM(Application Master)

  1. Node Manager:
    1. 周期型的向RM汇报节点资源情况和Container运行状态。
    2. 接收AM的命令。启动、停止Container。
  2. Application Master:用户提交每个任务都包含一个AM。AM的功能主要由:
    1. 切分数据。
    2. 为应用程序向RM申请资源(container)
    3. 与NM通信,启动、停止任务
    4. 监控任务运行状态。提供容错机制。

 

  1. Container:

Container是资源的抽象(内存和cpu)。

2. 作业提交流程

用户向YARN提交任务后,YARN分为两个阶段运行该应用程序。启动AM和AM创建应用程序、为任务申请资源、监控任务执行过程直到任务完成。

 

创建AM

1) 客户端向YARN提交应用程序,并请求RM分配资源

2) RM开启一个Container,并在上面运行AM。

AM创建应用程序

3) AM向RM中的ASM注册

4) AM向RM申请和获取资源。

5) AM获得资源后,将和资源对应的NM建立连接。

6) 启动任务,对应的Container会在AM处注册

7) 各个任务向AM周期型汇报执行情况。

 

8) AM运行完成后向RM注销并关闭自己

3. 需要完善】资源调度器

HADOOP的作业调度器有三种。先进先出调度器FIFO,容量调度器(capacity scheduler)和公平调度器(fair scheduler)。认为容量调度器。

 

(1) FIFO :队列保存job,先来的任务先执行。

(2) Capacity Scheduler:

支持多个队列,每个队列采用先进先出调度策略。

(3) Fair Scheduler:

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐