Hbase详解
HBase是一个开源的非关系型分布式数据库,实现的编程语言为Java。它是的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务。因此,它可以容错地存储海量稀疏的数据。
Hbase应用
HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的开源实现,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表。
为什么需要HBase?
-
Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于 HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求。
-
HDFS面向批量访问模式,不是随机访问模式。
-
传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题(分库分表也不能很好解决)。
-
传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间。
下面以hbase1.2.0版本给大家讲下安装教程:
老套路,先解压
tar -zxf hbase-1.2.0-cdh5.14.2.tar.gz
解压完后把文件加移动到soft目录下并改成好记忆的名称
mv hbase-1.2.0-cdh5.14.2 /opt/soft/hbase120
改好名称后进入新名称下,修改conf/文件下的配置文件hbase-env.sh
vi hbase-env.sh
export JAVA_HOME=/opt/jdk180 改jdk的路径
export HBASE_MANAGES_ZK=false 使用外部zookeeper,所以改成false
修改conf/文件下的配置文件hbase-site.xml
vi hbase-site.xml
<!—hbase.root.dir 将数据写入哪个目录 如果是单机版只要配置此属性就可以,
value中file:/绝对路径,如果是分布式则配置与hadoop的core-site.sh服务器、端口以及zookeeper中事先创建的目录一致-->
<property>