Bootstrap

linkhashmap原理_再谈数据结构,LinkedHashMap的小秘密都在这里

原标题:再谈数据结构,LinkedHashMap的小秘密都在这里

近日,中国移动发布统计数据,结果显示前期五省试点全行业累计携转用户占总用户比例仅为1.8%。近期26省试运行(11月10日至26日),全行业累计携转用户仅7.2万。

大家周一早上好,进入12月份了,记得防寒保暖哦!

本篇文章来自刁儿郎当的投稿,分享了他对LruCache中LinkedHashMap的理解,相信会对大家有所帮助!同时也感谢作者贡献的精彩文章。

刁儿郎当的博客地址:

https://www.jianshu.com/u/6a180f1b9934

LruCache本质就是在维护一个LinkedHashMap,具体为什么是LinkedHashMap而不是其他对象,我们通过以下几个问题来解释原因。

LinkedHashMap是个什么东西?

LinkedHashMap是干什么用的?

LinkedHashMap怎么用?

LinkedHashMap的原理是什么?怎么实现的?

/ 正文 /

LinkedHashMap是个什么东西?

LinkedHashMap是一个继承于HashMap,实现Map接口且有可预知迭代顺序的键值对存储列表。与HashMap的不同之处在于LinkedHashMap多维护了一个所有键值对的双向链表,而这个双向链表就定义了迭代顺序,和访问顺序。

简单来说就是:LinkedHashMap = HashMap + 双向链表。

LinkedHashMap是干什么用的?

LinkedHashMap主要用于需要知道访问顺序的场景,比如LruCache中,需要按put顺序或者访问时间顺序进行数据维护。又或者需要使用定长的缓存。

LinkedHashMap怎么用?

我们先看一个LinkedHashMap普通使用的例子。

例 1

publicclassLinkedHashMapActivityextendsAppCompatActivity{

LinkedHashMap linkedHashMap;

@Override

protectedvoidonCreate(Bundle savedInstanceState){

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_linked_hash_map);

linkedHashMap = newLinkedHashMap(2);

linkedHashMap.put(1, 1);

linkedHashMap.put(2, 2);

linkedHashMap.put(3, 3);

for(Map.Entry a : linkedHashMap.entrySet) {

Log.e("TAG", "key->"+ a.getKey + "");

Log.e("TAG", "value->"+ a.getValue + "");

}

}

}

2019-11-2114:32:17.3323310-3310/com.we.we E/TAG: key->1

2019-11-2114:32:17.3333310-3310/com.we.we E/TAG: value->1

2019-11-2114:32:17.3333310-3310/com.we.we E/TAG: key->2

2019-11-2114:32:17.3333310-3310/com.we.we E/TAG: value->2

2019-11-2114:32:17.3333310-3310/com.we.we E/TAG: key->3

2019-11-2114:32:17.3333310-3310/com.we.we E/TAG: value->3

其实普通的使用中LinkedHashMap和HashMap没有任何不同,都是实例化后进行put数据,而初始化时我们设置的初始容量是2,但是put了三个数据,实际打印的结果也是3条数据,因此初始化的2并不代表LinkedHashMap的最大容量。

那LinkedHashMap和HashMap到底有什么不同?我们再看一个例子。

例 2

publicclassLinkedHashMapActivityextendsAppCompatActivity{

LinkedHashMap linkedHashMap;

@Override

protectedvoidonCreate(Bundle savedInstanceState){

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_linked_hash_map);

linkedHashMap = newLinkedHashMap(2) {

@Override

protectedbooleanremoveEldestEntry(Entry eldest){

returnlinkedHashMap.size > 2;

}

};

linkedHashMap.put(1, 1);

linkedHashMap.put(2, 2);

linkedHashMap.put(3, 3);

for(Map.Entry a : linkedHashMap.entrySet) {

Log.e("TAG", "key->"+ a.getKey + "");

Log.e("TAG", "value->"+ a.getValue + "");

}

}

}

2019-11-2114:34:17.7083421-3421/com.we.we E/TAG: key->2

2019-11-2114:34:17.7083421-3421/com.we.we E/TAG: value->2

2019-11-2114:34:17.7083421-3421/com.we.we E/TAG: key->3

2019-11-2114:34:17.7083421-3421/com.we.we E/TAG: value->3

和第一个例子相比,在LinkedHashMap实例化的过程中,重写了removeEldestEntry方法,并根据当前linkedHashMap.size和设置容量的判断结果返回数据,明明put了3条数据,打印却只打印了最后put的2条,这一结果证实了2点。

LinkedHashMap的容量是可控的。

LinkedHashMap是有插入顺序的。

那LinkedHashMap访问有序是怎么体现的呢?是直接调用get方法就会自动排序么?我们写代码测试一下。

例 3

publicclassLinkedHashMapActivityextendsAppCompatActivity{

LinkedHashMap linkedHashMap;

@Override

protectedvoidonCreate(Bundle savedInstanceState){

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_linked_hash_map);

linkedHashMap = newLinkedHashMap(2) {

@Override

protectedbooleanremoveEldestEntry(Entry eldest){

returnlinkedHashMap.size > 2;

}

};

linkedHashMap.put(1, 1);

linkedHashMap.put(2, 2);

//调用get进行排序

linkedHashMap.get(1);

for(Map.Entry a : linkedHashMap.entrySet) {

Log.e("TAG", "key->"+ a.getKey + "");

Log.e("TAG", "value->"+ a.getValue + "");

}

}

}

2019-11-2114:55:08.4813843-3843/com.we.we E/TAG: key->1

2019-11-2114:55:08.4813843-3843/com.we.we E/TAG: value->1

2019-11-2114:55:08.4813843-3843/com.we.we E/TAG: key->2

2019-11-2114:55:08.4813843-3843/com.we.we E/TAG: value->2

还是以上的例子,我们在put完以后调用了get(1)再打印日志发现并没有按我们预想的顺序将1放在最后,因为LinkedHashMap按访问顺序排序默认是关闭的,可通过构造函数实例化的时候打开。比如这样:

例 4

publicclassLinkedHashMapActivityextendsAppCompatActivity{

LinkedHashMap linkedHashMap;

@Override

protectedvoidonCreate(Bundle savedInstanceState){

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_linked_hash_map);

//主要看最后这个参数,默认是false。

linkedHashMap = newLinkedHashMap(2,0.75f,true) {

@Override

protectedbooleanremoveEldestEntry(Entry eldest){

returnlinkedHashMap.size > 2;

}

};

linkedHashMap.put(1, 1);

linkedHashMap.put(2, 2);

//调用get进行排序

linkedHashMap.get(1);

for(Map.Entry a : linkedHashMap.entrySet) {

Log.e("TAG", "key->"+ a.getKey + "");

Log.e("TAG", "value->"+ a.getValue + "");

}

}

}

2019-11-2115:07:46.6724071-4071/com.we.we E/TAG: key->2

2019-11-2115:07:46.6724071-4071/com.we.we E/TAG: value->2

2019-11-2115:07:46.6724071-4071/com.we.we E/TAG: key->1

2019-11-2115:07:46.6724071-4071/com.we.we E/TAG: value->1

在初始化过程开启访问排序后,在通过日志发现,1已经排在的最后,达到了访问排序的效果。

以上的几个例子是LinkedHashMap的基本使用,但是具体为什么能达到这种效果,接下来我们深入源码了解LinkedHashMap的原理。

LinkedHashMap的原理是什么?怎么实现的?

首先我们了解LinkedHashMap的继承关系图,实线代表继承关系,虚线代表实现接口。

以上的继承关系中可以发现LinkedHashMap继承于HashMap,因此LinkedHashMap底层也是基于链表,如果JDK1.8以上就是链表+红黑树。而LinkedHashMap的不同之处就在于它又多维护了一个双向链表。

LinkedHashMap的双向链表对象都包含什么属性?

LinkedHashMap的双向链表对象是通过LinkedHashMapEntry对象来维护的,具体我们看下源码。

//LinkedHashMap.LinkedHashMapEntry

//继承于 HashMap.Node,获得普通链表的能力,同时通过内部属性 before, after;维护双向链表。

staticclassLinkedHashMapEntry extendsHashMap.Node{

//用来维护双向链表。

LinkedHashMapEntry before, after;

LinkedHashMapEntry(inthash, K key, V value, Node next) {

super(hash, key, value, next);

}

}

// HashMap.Node

// 链表元素对象

staticclassNode implementsMap.Entry{

finalinthash;

//元素的key

finalK key;

//值value

V value;

//下一个元素的数据

Node next;

...省略若干代码

}

// HashMap.TreeNode

//红黑树对象,主要看继承关系,如需了解内部逻辑可通过HashMap原理进行了解。

staticfinalclassTreeNode extendsLinkedHashMap.LinkedHashMapEntry{

TreeNode parent; // red-black tree links

TreeNode left;

TreeNode right;

TreeNode prev; // needed to unlink next upon deletion

booleanred;

TreeNode(inthash, K key, V val, Node next) {

super(hash, key, val, next);

}

}

以上源码中LinkedHashMapEntry就是LinkedHashMap中的每一个键值对对象,其中通过before, after两个属性维护了当前键值对的一前一后两个对象。以上源码的继承关系如下图所示:

补充一点小知识

HashMap.TreeNode继承LinkedHashMap.LinkedHashMapEntry,而LinkedHashMap.LinkedHashMapEntry又继承HashMap.Node,那为什么 HashMap.TreeNode不直接继承HashMap.Node?绕这一圈为的是什么?

其实LinkedHashMapEntry有组成双向链表的能力,继承了它就获得了这个能力,但是TreeNode 就多了两个用不到的引用 (LinkedHashMapEntry before, after;);同时内存占用也会比较大,这么做是为啥?

官方解释是说TreeNode是Node内存占用的2倍左右,但是TreeNode是在HashMap的桶中的节点足够多的时候才会使用,(JDK1.8 当一个桶中的元素超过8才会转换为红黑树(TreeNode),<6又转回链表(Node)) 如果hash算法不是很差的话TreeNode使用的几率是比较低的,因此浪费那一点空间换取了组成双向链表的能力是值得的。

如果TreeNode直接 extends Node 则需要Node extentds LinkedHashMapEntry,Node使用是很频繁的,这样空间浪费的就太多了。

LinkedHashMap对象是怎么维护每一个双向链表对象的?

既然LinkedHashMap内的每一个元素都包含其前后两个元素对象,那必然在put对象的过程中就进行了维护,因此我们先看下LinkedHashMap.put方法。

因为LinkedHashMap继承于HashMap,并且LinkedHashMap没有重写put,因此调用的就是父类HashMap的put,我们看下源码。

//HashMap的put方法,同时也是LinkedHashMap的put方法

publicV put(K key, V value){

returnputVal(hash(key), key, value, false, true);

}

//直接看关键部分的代码,看我注释的部分

finalV putVal(inthash, K key, V value, booleanonlyIfAbsent, booleanevict){

Node[] tab; Node p; intn, i;

if((tab = table) == null|| (n = tab.length) == 0)

n = (tab = resize).length;

if((p = tab[i = (n - 1) & hash]) == null)

//调用了newNode方法,这里用到了一个面向对象里多态的特性,而LinkedHashMap重写了newNode方法

//如果是LindedHashMap对象调用,触发的是LinkedHashMap重写的newNode

tab[i] = newNode(hash, key, value, null);

else{

Node e; K k;

if(p.hash == hash &&

((k = p.key) == key || (key != null&& key.equals(k))))

e = p;

elseif(p instanceofTreeNode)

e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);

else{

for(intbinCount = 0; ; ++binCount) {

if((e = p.next) == null) {

p.next = newNode(hash, key, value, null);

if(binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

treeifyBin(tab, hash);

break;

}

if(e.hash == hash &&

((k = e.key) == key || (key != null&& key.equals(k))))

break;

p = e;

}

}

//有重复的key,则用待插入值进行覆盖,返回旧值。

if(e != null) { // existing mapping for key

V oldValue = e.value;

if(!onlyIfAbsent || oldValue == null)

e.value = value;

//HashMap中该方法没做任何操作,LinkedHashMap进行了重写实现,并调用。

//该方法主要将当前节点移动到双向链表尾部,后续进行详细分析

afterNodeAccess(e);

returnoldValue;

}

}

++modCount;

if(++size > threshold)

resize;

//每次put新元素都会调用(如果是更新已有元素则不调用,因为没有新增元素,不会导致size+1)

//但是HashMap中该方法没做任何操作, LinkedHashMap进行了重写实现.

//主要用于移除最早的元素,后续详细解析

afterNodeInsertion(evict);

returnnull;

}

//HashMap内的newNode

Node newNode(inthash, K key, V value, Node next){

returnnewNode<>(hash, key, value, next);

}

//LinkedHashMap重写的newNode

Node newNode(inthash, K key, V value, Node e){

//构造带双向链表属性的对象。

LinkedHashMapEntry p =

newLinkedHashMapEntry(hash, key, value, e);

//双向链表维护

linkNodeLast(p);

returnp;

}

privatevoidlinkNodeLast(LinkedHashMapEntry p){

//首先获取当前链表的最后一个元素

LinkedHashMapEntry last = tail;

//当前插入的元素定义为最后一个元素

tail = p;

if(last == null)

//如果之前的最后元素是null,说明之前的链表就是空的,所以当前的元素是一个元素。

head = p;

else{

//如果之前的链表不是null

//put前的最后一个元素设置为当前put元素的前一个。

p.before = last;

//当前put元素设置为put前最后一个元素的下一个

last.after = p;

}

}

源码有点长,可以直接看我注释部分,注释部分完全可以描述新增键值对时双向链表的维护细节了。其实以上的大段逻辑做的事很简单。

先创建新的元素,通过hash计算位置并存放。

每次newNode创建元素时都连带调用linkNodeLast将新插入元素的双向链表关系维护起来(新插入的放末尾)。

每次put新元素均通过LinkedHashMap中重写的afterNodeInsertion判断是否删除头节点元素。

//这个方法是在HashMap的代码里调用的,在put方法中调用的时候参数evict传的是true

voidafterNodeInsertion(booleanevict){ // possibly remove eldest

LinkedHashMapEntry first;

//evict是true,(first = head)=true,而removeEldestEntry方法默认返回的是false,因此if内的逻辑默认是不执行的。

if(evict && (first = head) != null&& removeEldestEntry(first)) {

K key = first.key;

//移除链表头部的元素

removeNode(hash(key), key, null, false, true);

}

}

//HashMap中的removeNode方法,主要用于删除某一个元素

finalNode removeNode(inthash, Object key, Object value,

booleanmatchValue, booleanmovable){

Node[] tab; Node p; intn, index;

...省略若干代码

}

通过以上代码发现,其实每次调用afterNodeInsertion方法,只是内部的if判断中removeEldestEntry默认返回false ,因此移除链表头部元素的逻辑没能执行,但是可通过重写removeEldestEntry方法手动返回true,这样可以做到每添加一个元素都移除头部的元素。

如果put的key已存在则用新值覆盖并调用LinkedHashMap重写的afterNodeAccess将新值移动到链表尾部。

voidafterNodeAccess(Node e){ // move node to last

LinkedHashMapEntry last;

//accessOrder 是LinkedHashMap实例化的时候的入参,需手动传true该方法的逻辑才会启用。

if(accessOrder && (last = tail) != e) {

LinkedHashMapEntry p = (LinkedHashMapEntry)e, b = p.before, a = p.after;

//p为当前尾节点,因此p.after = null;

p.after = null;

//p.before==null,说明p以前是头节点,但是现在需要把p放在尾节点,则以前p.after就变成了头节点。

if(b == null)

head = a;

else

//原来的顺序是b p a...现在p需要移动到尾部,则就变成了b a...... p

b.after = a;

if(a != null)

//原来a.before是p,现在p移动走了,那p.before就变成了a.before

a.before = b;

else

//如果之前p就是尾节点,则将last引用p.before

last = b;

if(last == null)

//如果原来尾节点是空,则说明当前链表只有一个节点,因此head引用p

head = p;

else{

//之前尾节点不为空,因为p移动到了最后,因此p.before引用原尾节点,原尾节点.after引用p

p.before = last;

last.after = p;

}

tail = p;

//计数器自增1

++modCount;

}

}

以上复杂的操作均是处理链表移动的各种异常情况,最终目的是将put的元素移动到链表末端。

注意:在afterNodeAccess函数中,会修改modCount变量,迭代LinkedHashMap时,如果同时查询访问数据,也会导致fail-fast,因为迭代的顺序已经改变。

LinkedHashMap为什么调用get就会触发排序?

以上例 4已经展示了调用get排序的场景,如不记得例4的逻辑,可上翻查看。老规矩吧,点看源码一顿瞅....

//LinkedHashMap重写的get方法

publicV get(Object key){

Node e;

//getNode调用是HashMap.getNode

if((e = getNode(hash(key), key)) == null)

returnnull;

if(accessOrder)

//哈哈哈,看到这我一下子就明白他怎么做的排序了。

afterNodeAccess(e);

returne.value;

}

LinkedHashMap每次调用get方法,在结果返回前就触发了afterNodeAccess,而afterNodeAccess作用就是将当前元素移动到尾节点。

LinkedHashMap调用remove后链表怎么维护?

首先我们猜下,如果是我们自己实现这个逻辑需要怎么操作?比如现在调用remove,删了了链表中间的一个元素,应该怎么维护?

首先我们通过当前元素前后的元素获取前后节点,然后让前后节点做关联,但是需要注意首位节点。

如果LinkedHashMap重写了remove则在重写的方法里实现逻辑,如果调用的是HashMap.remove则需要有和afterNodeAccess类似的after...方法进行重写实现,且after...方法需在remove方法中调用。

我们验证下猜想是否正确。

//HashMap.remove

publicV remove(Object key){

Node e;

return(e = removeNode(hash(key), key, null, false, true)) == null?

null: e.value;

}

//HashMap.removeNode,核心的删除方法

finalNode removeNode(inthash, Object key, Object value, booleanmatchValue, booleanmovable){

Node[] tab; Node p; intn, index;

if((tab = table) != null&& (n = tab.length) > 0&&

(p = tab[index = (n - 1) & hash]) != null) {

Node node = null, e; K k; V v;

if(p.hash == hash &&

((k = p.key) == key || (key != null&& key.equals(k))))

node = p;

elseif((e = p.next) != null) {

if(p instanceofTreeNode)

node = ((TreeNode)p).getTreeNode(hash, key);

else{

do{

if(e.hash == hash &&

((k = e.key) == key ||

(key != null&& key.equals(k)))) {

node = e;

break;

}

p = e;

} while((e = e.next) != null);

}

}

if(node != null&& (!matchValue || (v = node.value) == value ||

(value != null&& value.equals(v)))) {

if(node instanceofTreeNode)

((TreeNode)node).removeTreeNode(this, tab, movable);

elseif(node == p)

tab[index] = node.next;

else

p.next = node.next;

++modCount;

--size;

//维护双向链表的after...方法,在HashMap中该方法是空方法。

afterNodeRemoval(node);

returnnode;

}

}

returnnull;

}

//LinkedHashMap重写的afterNodeRemoval方法

voidafterNodeRemoval(Node e){ // unlink

LinkedHashMapEntry p = (LinkedHashMapEntry)e, b = p.before, a = p.after;

//首先删除元素的前后节点引用置空

p.before = p.after = null;

if(b == null)

//如果当前元素的前节点是null,则证明当前元素原来是头节点。

//因此删除当前元素后,当前元素的后节点就变成了头节点。

head = a;

else

//如果前节点不为null,则前节点的after引用后节点。

b.after = a;

if(a == null)

//如果当前元素的后节点为null,则说明当前元素为尾节点,删除当前元素后,尾节点变成当前元素的前节点。

tail = b;

else

//尾节点不为null,尾节点的前节点引用删除元素的前节点。

a.before = b;

}

通过以上源码可见跟我们猜想一致,我们简单总结下。

LinkedHashMap.remove其实调用的是HashMap.remove

HashMap.remove中调用了HashMap.removeNode。

HashMap.removeNode中调用了afterNodeRemoval,而LinkedHashMap中重写了afterNodeRemoval,因此最终的维护链表逻辑是在LinkedHashMap.afterNodeRemoval中。

至此,LinkedHashMap的继承关系,添加,获取,移除三大主要方法,以及内部的排序处理逻辑已经分析完了,HashMap凭借强大的设计模式,让LinkedHashMap重写了以下3个必要方法就基本实现了全部功能。

void afterNodeAccess(Node p) { }

void afterNodeInsertion(boolean evict) { }

void afterNodeRemoval(Node p) { }

接下来我们针对一些LinkedHashMap的特性补充一点小知识。

LinkedHashMap的containsValue()进行了重写,相对HashMap大幅度提升了性能。

//LinkedHashMap.containsValue

publicbooleancontainsValue(Object value){

//循环查找所有键值对的中和value重复的数据

for(LinkedHashMapEntry e = head; e != null; e = e.after) {

V v = e.value;

if(v == value || (value != null&& value.equals(v)))

returntrue;

}

returnfalse;

}

//HashMap.containsValue

publicbooleancontainsValue(Object value){

Node[] tab; V v;

if((tab = table) != null&& size > 0) {

//双重for循环查找数据

for(inti = 0; i < tab.length; ++i) {

for(Node e = tab[i]; e != null; e = e.next) {

if((v = e.value) == value ||

(value != null&& value.equals(v)))

returntrue;

}

}

}

returnfalse;

}

以上两个containsValue方法中,LinkedHashMap针对的是链表循环,循环的是所有有效的数据,而HashMap中,是双重for循环,先循环桶,后循环每个桶的数据,双重for循环这一点效率就偏低,其次HashMap循环的是所有的桶,但并不是所有桶都有数据。

LinkedHashMap.LinkedHashIterator.nextNode相对HashMap.HashIterator.nextNode大幅度提升了性能。

// LinkedHashMap.LinkedHashIterator.nextNode

finalLinkedHashMapEntry nextNode{

LinkedHashMapEntry e = next;

if(modCount != expectedModCount)

thrownewConcurrentModificationException;

if(e == null)

thrownewNoSuchElementException;

current = e;

next = e.after;

returne;

}

//HashMap.HashIterator.nextNode

finalNode nextNode{

Node[] t;

Node e = next;

if(modCount != expectedModCount)

thrownewConcurrentModificationException;

if(e == null)

thrownewNoSuchElementException;

if((next = (current = e).next) == null&& (t = table) != null) {

//循环HashMap中给每一个桶

do{} while(index < t.length && (next = t[index++]) == null);

}

returne;

}

同样的道理,LinkedHashMap循环的是有效链表数据,HashMap循环了所有的桶,不管桶里有没有数据。

LinkedHashMap的各个维度已经分析完了,篇幅较长,如果你已经看到了这里,那么对LinkedHashMap就有了相对全面的了解,但是还是建议多写代码多测试,实践才是检验原理的唯一标准。返回搜狐,查看更多

责任编辑:

;