-
架构
- HDFS:数据存储 -NameNode:元数据(索引) -Datanode:具体的数据 -SeconDaryNameNode:不是NameNode的热备 - Yarn:资源调度 -ResourceManager:所有节点的老大(一个RM管理多个NM) -NodeManager:单个节点的老大(一个NM管理多个container) -container:每一个容器都是一个资源的集合(硬盘,内存,cpu,网络) - ApplicationMaster:单个任务的老大 - 所有的MapReduce的任务都是Container中运行的 - 选择节点的时候原则(就近 - 随机) @H_404_10@
- MapReduse:计算
- MapTask
- ReduceTask
@H_404_10@
HDFS
MapReduce
- MR的shuffle?
- 1.输入数据执行Map任务
- 2.写入缓存
- 3.溢写
- 4.文件归并
- MR的工作流程
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。