微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

hbase的基础学习

  Hbase的应用场景及特点

  Hbase的概念与定位

  Hbase的架构体系与设计模型

  Hbase的安装部署

  Hbase的Shell基本使用

 

一:Hbase的应用场景及特点

1.能做什么

  海量数据存储

  准实时查询

  

2.实际业务场景

  交通:GPS里的数据

  金融:刷卡,交易信息

  电商:物流,浏览日志信息

  移动

  

3.Hbase的特点

  容量大:可以有百亿行,百万列。数据矩阵横向和纵向两位维度支持的数据量都非常具有弹性

  面向列:面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询少数几个字段的售后,可以大大减少读取的数据量

  多版本:每一个列可以存储多个版本version

  稀疏性:为空的列并不占用存储空间

  扩展性:底层依赖于HDFS

  高可靠性:WAL机制保证了数据写入时不会因为集群异常而导致写入数据丢失;replication机制保证了集群出现严重问题时,数据不会发生丢失或者损坏。而且底层的hdfs也有备份。

  高性能:底层的LSM数据结构和rowkey的有序排列等架构上的独立设计,使得非常高的写入性能。region切分,主键索引,缓存机制使得hbase在海量数据下具有一定的随机读取性能,该性能针对rowkey的查询能够达到毫秒级别。

 

 

二:Hbase的概念与定位

1.官网的描述

  https://hbase.apache.org/  

  Welcome to Apache HBase™

        Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.

Use Apache HBase™ when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware. Apache HBase is an open-source, distributed, versioned, non-relational database modeled after Google's Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable Leverages the distributed data storage provided by the Google File System, Apache HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.

 

  来源于谷歌的三篇论文:HDFS,MapReduce,HBase

 

2.hadoop中的定位

 

 

三:Hbase的架构体系与设计模型

 

 

 

四:Hbase的安装部署

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐