Bootstrap

笔记--HBASE结构以及操作

HBASE的特性:
    
    hbase是一个分布式数据库系统,数据增删改查功能模块是分布式系统;
    hbase的数据最终持久化存储是基于HDFS的,存储容量可以随时在线扩容;
    是非关系型数据库(nosql)。

HBASE的表结构:

    每个表有一个表名。
    表中有行键(rowkey),列族(base_info,extra_info)。
    一个表可以分为多个列族,不同列族的数据存储在不同的文件中
    表中每一行有一个行键,且行键在表中不能重复

    行键和列族可以确定多个键值对,每个键值对为一个cell(单元)。
    每个cell中key可以存储多个value版本,调用时默认调用最新版本,hbase中的数据不能修改,只能添加或删除
    整张表由于数据量过大,会被横向切成若干个region,用rowkey范围标识,不同regioin的数据会存储在不同的文件中

HBASE数据存储顺序:

    插入到hbase中去的数据,hbase会自动排序存储
    首先按rowkey排序
    同一行里的kv按照列族排序
    最后按照k排序

HBASE表中存储的数据类型:
    
    hbase中只支持字节型数组byte[],byte[]包括rowkey,key,value,列族名,表名

HBASE 命令行客

;