Hbase的应用场景及特点
Hbase的概念与定位
Hbase的架构体系与设计模型
Hbase的安装部署
Hbase的Shell基本使用
一:Hbase的应用场景及特点
1.能做什么
海量数据存储
准实时查询
2.实际业务场景
交通:GPS里的数据
金融:刷卡,交易信息
电商:物流,浏览日志信息
移动
3.Hbase的特点
容量大:可以有百亿行,百万列。数据矩阵横向和纵向两位维度支持的数据量都非常具有弹性
面向列:面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询少数几个字段的售后,可以大大减少读取的数据量
多版本:每一个列可以存储多个版本version
稀疏性:为空的列并不占用存储空间
扩展性:底层依赖于HDFS
高可靠性:WAL机制保证了数据写入时不会因为集群异常而导致写入数据丢失;replication机制保证了集群出现严重问题时,数据不会发生丢失或者损坏。而且底层的hdfs也有备份。
高性能:底层的LSM数据结构和rowkey的有序排列等架构上的独立设计,使得非常高的写入性能。region切分,主键索引,缓存机制使得hbase在海量数据下具有一定的随机读取性能,该性能针对rowkey的查询能够达到毫秒级别。
二:Hbase的概念与定位
1.官网的描述
https://hbase.apache.org/
Welcome to Apache HBase™
Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.
Use Apache HBase™ when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware. Apache HBase is an open-source, distributed, versioned, non-relational database modeled after Google's Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable Leverages the distributed data storage provided by the Google File System, Apache HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.
来源于谷歌的三篇论文:HDFS,MapReduce,HBase
2.hadoop中的定位
三:Hbase的架构体系与设计模型
四:Hbase的安装部署
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。