微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

2021-10-26

**大数据技术生态体系:

在这里插入图片描述

Hadoop是什么:

**
1·分布式系统基础架构

什么是分布式系统 100T的文件 由100个服务器存储 即需要多台服务器同时运行
基础架构? 所有的框架都基于Hadoop执行

2.主要解决 海量数据的存储分析计算问题
3.广义上指Hadoop生态圈

Google在大数据方面的三篇论文

在这里插入图片描述

Hadoop的优势:

在这里插入图片描述

Hadoop的组成:

在这里插入图片描述

HDFS概述:

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

YARN结构概述

理解为Resource Manager是一个公司的部门经理
Node Manager是一个公司的项目经理
App Mstr就是一个小的项目
Container是一个容器,用于App Mstr的正常运行

在这里插入图片描述

这里是引用

MapReduce架构概述:

在这里插入图片描述

案例:

在这里插入图片描述

** 怎么被大数据推荐商品的??**

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐