文章目录
读数据流程
1)HRegionServer保存着Meta表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面获取Meta表所在的位置信息,即找到这个Meta表在哪个HRegionServer上保存着
2)接着Client通过刚才获取的HRegionServer的IP来访问Meta表所在的HRegionServer,从而读取到Meta,进而获取Meta表中存放的元数据
3)Client通过元数据中存储的信息,访问对应的HRegionServer,然后扫描所在HRegionServer的Memstore和StoreFile来查询数据
4)最后 HRegionServer把查询到的数据响应给Client
写数据流程
1)Client 先访问zookeeper,找到Meta表,并获取Meta信息
2)确定当前将要写入的数据所对应的RegionServer服务器和Region
3)Client向该RegionServer服务器发起写入数据请求,然后RegionServer收到请求并响应
4)Client先把数据写入到HLog,防止数据丢失
5)然后将数据写入的Memstore
如果HLog和Memstore均写入成功,则这条数据写入成功,在此过程中,如果MemStore达到阈值,会把Memstore中的数据flush到StoreFile中
当StoreFile越来越多,会触发Compact合并操作,把过多的StoreFile合并成一个大的StoreFile,当StoreFile越来越大,Region也会越来越大,达到阈值后,会触发Split操作,将Region一分为二
注意:内存空间有限,溢写过程中必定伴随着大量小文件的产生
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。