Bootstrap

大数据-Hadoop-基础篇-第五章-HBase (分布式 NoSQL 数据库)

参考

经典大数据开发实战(Hadoop &HDFS&Hive&Hbase&Kafka&Flume&Storm&Elasticsearch&Spark)
Hbase java API

概念

Hbase 是 Hadoop database 的简称,也就是基于 Hadoop 数据库,是一种 NoSQL 数据库,主要适用于海量明细数据(十亿、百亿)的随机实时 查询,如日志明细、交易清单、轨迹行为等。

HBase 表是物理表,适合存放非结构化的数据。提供一个超大的内存 hash 表,搜索引擎通过它来存储索引,方便查询操作。

HBase 基于 Hadoop 的 HDFS 存储, zookeeper 进行管理,处理数据是基于 列 的而不是基于行的模式,适合海量数据的随机访问。

HBase 是近实时系统,支持实时查询,支持增删改查。

使用流程

在这里插入图片描述

示例

创建用户表,有两个列族,info和grade

在这里插入图片描述
对应hdfs中数据如下
在这里插入图片描述

命令

创建一个名为 test 的表,这个表只有一个 列族 为 cf。可以列出所有的表来检查创建情况,然后插入些值。

hbase(main):003:0> create 'test', 'cf'
0 row(s) in 1.2200 seconds
hbase(main):003:0> list 'table'
test
1 row(s) in 0.0550 seconds
hbase(main):004:0> put 'test', '
;