Hadoop作为开源项目,很多分枝。也有很多社区的支持。所以hadoop版本发展很快。
大部分情况下,我们可以选择
Apache社区版本:
完全开源,免费,非商业。apache社区的hadoop版本分枝较多,而且部分hadoop存在bug。在选择hadoop,hbase,hive等时,需要考虑兼容性。
Cloudera版本:
开源,免费,有商业和非商业版本。是在apache社区版本的hadoop基础上,选择相对稳定版本的hadoop,并在此基础上,进行bug修改和维护。使用者不必考虑hadoop,hbase,hive等在使用过程中,版本兼容性。
Hortonworks版本:
开源,免费,有商业和非商业版本。是在Apache基础上修改,具有apache的特色。
推荐:
实验环境使用cloudera,生产环境,看情况而定。
hadoop版本
Apache Hadoop的版本,目前有1.x 和 2.x版本。3.x版本在测试中。
1.x版本,比较经典,使用者很多。2.x版本,和1.x并不兼容。2.x完全推翻了1.x的代码,重新编写的。内部思想有借鉴。
A.经典版本 0.20.2 → 1.0.0 (第一个1.0.0的正式版本) → 1.0.3和1.0.4 (生产环境使用的较多的版本) → 1.1.2, 1.2.1(目前最新版本)
B.上面的0.21.0和0.22.0 这个分枝,就不提了。
C.下面说0.23.0(跨越版本,Yarn框架,第二代MapReduce框架,资源管理和任务调度框架) → xxx →0.23.10(目前最新版本,不过和2.x有点区别,就是不支持HA和Federation)
D.下面就是2.x版本了。将1.x和0.23.0系列合并。
①2.0.x版本:属于2.x系列版本的alpha版本。
②2.1.x版本:属于2.x系列版本的beta版本。
③2.2.0 ,2.3.0 , 2.4.0 正式版本,可用于实际生产环境中。