微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hadoop面试总结三Hbase、Spark

Hbase

Hbase 的角色:Hmaster和RegionServer

Hmaster:

管理RegionServer:监控和处理故障转移

Region的分配

 

RegionServer:

存储Hbase的真实数据

处理Hmaster分配给他的Region

Hbase 的架构

有两种:一种是作为存储的分布式文件系统、一种是作为数据处理的MR架构

 

Hbase读流程

因为表和表数据都是在HRegionServer上存放的,所以要先找到存放数据的那个HRegionServer;客户端去访问Zookeeper,从Zookeeper获取Meta表所在的位置信息;

找到存放这个Meta表的HRegionServer,获取Meta中的元数据,根据元数据信息访问对应的HRegionServer;

Hbase写流程

Client先访问Zookeeper,找到Meta表,并获取Meta表信息,确认要写入的HRegionServer;然后客户端想HRegionServer发起写入数据请求,收到HregionServer相应后开始写入数据;数据先写入HLog,防止数据丢失。然后写入Memstore,两者都写入成功则代表数据写入成功。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐