1、历史背景
-
产生原因
-
内因
-
hadoop之mapreduce/hdfs/hive等适合做批量数据处理,且只能以顺序方式访问数据。
-
-
外因
-
现实开发应用场景中,经常需要海量数据场景下的实时数据随机访问的需求,hadoop作为大数据的承载和计算平台应该予以满足。
-
-
2、hbase概述
-
hbase介绍
-
hbase与hdfs对比说明
HDFS |
HBase |
建立在HDFS之上的数据库 |
|
批量任务处理,吞吐量高时延高、实时性差 |
提供了亿级记录低延迟访问任意行记录,即随机存取 |
-
应用场景
-
应用案例
-
数据采集结果存储、海量数据实时查询等项目开发当中使用非常广泛。
-
国外的facebook、google、yahoo!,国内的互联网中大型公司、BAT内部均有广泛使用。
-
-
hbase数据模型
-
重要概念
-
命名空间(namespace)
-
表(table)
-
类比于rdb中的表
-
以"表"为单位组织数据,表由多行组成
-
-
行(row)
-
列族(column family,简称CF)
-
列限定符(column qualifier)
-
列由列族和列限定符唯一指定,像如上的name、age即是baseInfo列族的列限定符。
-
-
单元格(cell)
-
时间戳(timestamp)
-
-
核心设计
-
简易逻辑说明
-
表是行的集合
-
行是列族的集合
-
列族是列的集合
-
列是键值对的集合
-
-
hbase数据表模板
-
Rowid |
Column Family |
Column Family |
|||
|
column1 |
column2 |
column3 |
column1 |
column2 |
rowkey1 |
|
|
|
|
|
rowkey2 |
|
|
|
|
|
rowkey3 |
|
|
|
|
|
-
hbase数据表样例(学生信息表)
Rowid |
baseInfo |
addressInfo |
|||
|
name |
age |
gender |
province |
city |
20190901 |
张一 |
21 |
男 |
河北省 |
石家庄市 |
20190902 |
张二 |
22 |
女 |
河南省 |
郑州市 |
20190903 |
张三 |
21 |
男 |
内蒙古 |
赤峰市 |
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。