Bootstrap

Java数据结构与算法——手撕LRU&LFU算法

LRU算法

力扣146:https://leetcode-cn.com/problems/lru-cache/

讲解视频:https://www.bilibili.com/video/BV1Hy4y1B78T?p=65&vd_source=6f347f8ae76e7f507cf6d661537966e8

LRU是Least Recently Used的缩写,是一种常用的页面置换算法,选择最近最久未使用的数据予以淘汰。(操作系统)

分析:

1 所谓缓存,必须要有读+写两个操作,按照命中率的思路考虑,写操作+读操作时间复杂度都需要为O(1)

2 特性要求分析
2.1 必须有顺序之分,以区分最近使用的和很久没用到的数据排序。
2.2 写和读操作 一次搞定。
2.3 如果容量(坑位)满了要删除最不长用的数据,每次新访问还要把新的数据插入到队头(按照业务你自己设定左右那一边是队头)

查找快,插入快,删除快,且还需要先后排序-------->什么样的数据结构满足这个问题?

你是否可以在O(1)时间复杂度内完成这两种操作?

如果一次就可以找到,你觉得什么数据结构最合适??

LRU的算法核心是哈希链表,本质就是HashMap+DoubleLinkedList 时间复杂度是O(1),哈希表+双向链表的结合体

利用JDK的LinkedHashMap实现:

在这里插入图片描述

LRU(The Least Recently Used,最近最久未使用算法)是一种常见的缓存算法,在很多分布式缓存系统(如Redis, Memcached)中都有广泛使用。

LRU算法的思想是:如果一个数据在最近一段时间没有被访问到,那么可以认为在将来它被访问的可能性也很小。因此,当空间满时,最久没有访问的数据最先被置换(淘汰)

LRU算法的描述: 设计一种缓存结构,该结构在构造时确定大小,假设大小为 K,并有两个功能:

  1. set(key,value):将记录(key,value)插入该结构。当缓存满时,将最久未使用的数据置换掉。
  2. get(key):返回key对应的value值。

实现:最朴素的思想就是用数组+时间戳的方式,不过这样做效率较低。因此,我们可以用双向链表(LinkedList)+哈希表(HashMap)实现(链表用来表示位置,哈希表用来存储和查找),在Java里有对应的数据结构LinkedHashMap

利用JavaLinkedHashMap用非常简单的代码来实现基于LRU算法的Cache功能,代码如下:

import java.util.LinkedHashMap;
import java.util.Map;

/**
 * Title:力扣146 - LRU 缓存机制
 * Description:最近最久未使用算法
 *              双向链表+Hash实现,LinkedHashMap
 * @author WZQ
 * @version 1.0.0
 * @date 2020/12/24
 */
public class LRUCache{

     // 思路1 使用LinkedHashMap jdk自带
    public LinkedHashMap<Integer, Integer> map;

    public LRUCache(int capacity) {
        // true表示纪录访问的顺序,false的话,按第一次插入的顺序不变
        map = new LinkedHashMap(capacity, 0.75f, true){
            // 最近最久未使用删除
            @Override
            protected boolean removeEldestEntry(Map.Entry eldest) {
                return this.size() > capacity;
            }
        };
    }

    public int get(int key) {
        return map.get(key) == null ? -1 : map.get(key);
    }

    public void put(int key, int value) {
        map.put(key, value);
    }

    public static void main(String[] args) {
        LRUCache lruCache = new LRUCache(3);

        lruCache.put(1,"a");
        lruCache.put(2,"b");
        lruCache.put(3,"c");
        System.out.println(lruCache.keySet());

        lruCache.put(4,"d");
        System.out.println(lruCache.keySet());

        lruCache.put(3,"c");
        System.out.println(lruCache.keySet());
        lruCache.put(3,"c");
        System.out.println(lruCache.keySet());
        lruCache.put(3,"c");
        System.out.println(lruCache.keySet());
        lruCache.put(5,"x");
        System.out.println(lruCache.keySet());
    }

}

/**
 * true
 * [1, 2, 3]
 * [2, 3, 4]
 * [2, 4, 3]
 * [2, 4, 3]
 * [2, 4, 3]
 * [4, 3, 5]
 * false
 * [1, 2, 3]
 * [2, 3, 4]
 * [2, 3, 4]
 * [2, 3, 4]
 * [2, 3, 4]
 * [3, 4, 5]
 */

手写LRU:

import java.util.HashMap;
import java.util.Map;

/**
 * Title:146. LRU 缓存
 * Description:LRU
 * @author WZQ
 * @version 1.0.0
 * @date 2023/2/26
 */
class LRUCache {

    /**
     * 数据结点
     * @param <K>
     * @param <V>
     */
    class Node<K, V>{
        K key;
        V value;
        Node<K, V> prev;
        Node<K, V> next;

        public Node() {
            this.prev = this.next = null;
        }

        public Node(K key, V value){
            this.prev = this.next = null;
            this.key = key;
            this.value = value;
        }
    }

    /**
     * 双端链表
     * @param <K>
     * @param <V>
     */
    class DoubleLinkedList<K, V>{
        Node<K, V> head;
        Node<K, V> tail;

        public DoubleLinkedList() {
            // 头结点不删
            head = new Node<>();
            tail = new Node<>();
            head.next = tail;
            tail.prev = head;
        }

        // 头放最久未使用,尾放最新访问

        // 删除节点
        public void removeNode(Node<K, V> node){
            node.next.prev = node.prev;
            node.prev.next = node.next;
            node.prev = null;
            node.next = null;
        }

        // 添加到尾
        public void addTail(Node<K, V> node){
            node.prev = tail.prev;
            node.next = tail;
            tail.prev.next = node;
            tail.prev = node;
        }

        // 获取最久未使用节点
        public Node<K, V> getLast() {
            return head.next;
        }
    }

    private int capacity;
    private DoubleLinkedList<Integer, Integer> doubleLinkedList;
    private HashMap<Integer, Node<Integer, Integer>> map;

    // 思路2 手写 双端链表+哈希     时间复杂度: put O(1) get O(1) 
    public LRUCache(int capacity) {
        this.capacity = capacity;
        doubleLinkedList = new DoubleLinkedList();
        map = new HashMap<>();
    }

    public int get(int key) {
        if (!map.containsKey(key)) {
            return -1;
        }
        Node<Integer, Integer> node = map.get(key);
        doubleLinkedList.removeNode(node);
        doubleLinkedList.addTail(node);
        return node.value;
    }

    public void put(int key, int value) {
        if (map.containsKey(key)){
            // 已存在节点
            // 删除节点,放到尾部
            Node<Integer, Integer> node = map.get(key);
            node.value = value;
            doubleLinkedList.removeNode(node);
            doubleLinkedList.addTail(node);
        }else {
            // 未存在节点
            if (capacity == map.size()){
                // 缓存数已满,需删除最久未使用
                Node<Integer, Integer> last = doubleLinkedList.getLast();
                doubleLinkedList.removeNode(last);
                map.remove(last.key);
            }
            Node<Integer, Integer> node = new Node<Integer, Integer>(key, value);
            doubleLinkedList.addTail(node);
            map.put(key, node);
        }
    }

    public static void main(String[] args) {
        LRUCache lruCacheDemo = new LRUCache(3);

        lruCacheDemo.put(1, 1);
        lruCacheDemo.put(2, 2);
        lruCacheDemo.put(3, 3);
        System.out.println(lruCacheDemo.map.keySet());

        lruCacheDemo.put(4, 1);
        System.out.println(lruCacheDemo.map.keySet());

        lruCacheDemo.put(3, 1);
        System.out.println(lruCacheDemo.map.keySet());
        lruCacheDemo.put(3, 1);
        System.out.println(lruCacheDemo.map.keySet());
        lruCacheDemo.put(3, 1);
        System.out.println(lruCacheDemo.map.keySet());
        lruCacheDemo.put(5, 1);
        System.out.println(lruCacheDemo.map.keySet());

    }
}

/**
 [1, 2, 3]
 [2, 3, 4]
 [2, 3, 4]
 [2, 3, 4]
 [2, 3, 4]
 [3, 4, 5]
 */

LFU算法

力扣:https://leetcode.cn/problems/lfu-cache/description/

LFU(Least Frequently Used ,最近最少使用算法)也是一种常见的缓存算法。

顾名思义,LFU算法的思想是:如果一个数据在最近一段时间很少被访问到,那么可以认为在将来它被访问的可能性也很小。因此,当空间满时,最小频率访问的数据最先被淘汰如果访问频率相同,则淘汰最久未访问的。

LFU 算法的描述:

设计一种缓存结构,该结构在构造时确定大小,假设大小为 K,并有两个功能:

  1. set(key,value):将记录(key,value)插入该结构。当缓存满时,将访问频率最低的数据置换掉。
  2. get(key):返回key对应的value值。

算法实现策略:考虑到 LFU 会淘汰访问频率最小的数据,我们需要一种合适的方法按大小顺序维护数据访问的频率。LFU 算法本质上可以看做是一个 top K 问题(K = 1),即选出频率最小的元素,因此我们很容易想到可以用二项堆来选择频率最小的元素,这样的实现比较高效。最终实现策略为小顶堆+哈希表,时间复杂度O(logn),代码如下:

import java.util.Arrays;
import java.util.HashMap;
import java.util.PriorityQueue;
import java.util.TreeSet;

/**
 * Title:leetcode --> 460. LFU 缓存
 * Description:LFU
 *
 * 方法1:哈希表 + 最小堆/平衡二叉树TreeSet   
 * 时间复杂度:put O(logn) get O(logn) 堆运算
 *
 * @author WZQ
 * @version 1.0.0
 * @date 2023/2/26
 */
class LFUCache {

    PriorityQueue<Node<Integer, Integer>> minHeap;
    HashMap<Integer, Node<Integer, Integer>> map;
    // 访问时间
    int visitTime;
    int capacity;

    /**
     * 数据结点
     * @param <K>
     * @param <V>
     */
    class Node<K, V> implements Comparable<Node>{
        K key;
        V value;
        // 访问次数
        int count;
        // 最新的时间,越小表示越久未访问
        int lastTime;

        public Node(K key, V value){
            this.key = key;
            this.value = value;
            this.count = 1;
        }

        public Node(){
        }

        @Override
        public int compareTo(Node node) {
            // 访问次数一样,则取最久未访问的
            return count == node.count ? lastTime - node.lastTime : count - node.count;
        }
    }

    public LFUCache(int capacity) {
        visitTime = 0;
        this.capacity = capacity;
        map = new HashMap<>();
        minHeap = new PriorityQueue<>();
    }

    public int get(int key) {
        if (!map.containsKey(key)){
            return -1;
        }
        Node<Integer, Integer> node = map.get(key);
        // 删除元素,重新入堆排序
        minHeap.remove(node);
        node.count ++;
        node.lastTime = ++ visitTime;
        minHeap.offer(node);
        return node.value;
    }

    public void put(int key, int value) {
        if (map.containsKey(key)){
            // 访问+1,置成最新
            Node<Integer, Integer> node = map.get(key);
            minHeap.remove(node);
            node.value = value;
            node.count++;
            node.lastTime = ++ visitTime;
            minHeap.offer(node);
        }else {
            // 容量已满,剔除最小元素(最久未访问)
            if (capacity == map.size()){
                Node<Integer, Integer> minNode = minHeap.poll();
                map.remove(minNode.key);
            }
            Node<Integer, Integer> node = new Node<>(key, value);
            node.lastTime = ++ visitTime;
            map.put(key, node);
            minHeap.offer(node);
        }
    }

}

双hash表思路,详细可见leetcode讲解视频:https://leetcode.cn/problems/lfu-cache/solutions/186348/lfuhuan-cun-by-leetcode-solution/

时间复杂度O(1),代码如下:

import java.util.HashMap;
import java.util.Map;

/**
 * Title:leetcode --> 460. LFU 缓存
 * Description:LFU
 *
 * 双Hash表  时间复杂度 O(1)
 *
 * @author WZQ
 * @version 1.0.0
 * @date 2023/2/26
 */
class LFUCache2 {

    /**
     * 数据结点
     * @param <K>
     * @param <V>
     */
    class Node<K, V>{
        K key;
        V value;
        // 访问次数
        int count;
        Node<K, V> prev;
        Node<K, V> next;

        public Node() {
            this.prev = this.next = null;
        }

        public Node(K key, V value){
            this.prev = this.next = null;
            this.key = key;
            this.value = value;
            count = 1;
        }
    }

    /**
     * 双端链表
     * @param <K>
     * @param <V>
     */
    class DoubleLinkedList<K, V>{
        Node<K, V> head;
        Node<K, V> tail;
        int size;

        public DoubleLinkedList() {
            // 头结点不删
            head = new Node<>();
            tail = new Node<>();
            head.next = tail;
            tail.prev = head;
            size = 0;
        }

        // 头放最久未使用,尾放最新访问

        // 删除节点
        public void removeNode(Node<K, V> node){
            node.next.prev = node.prev;
            node.prev.next = node.next;
            node.prev = null;
            node.next = null;
            size --;
        }

        // 添加到尾
        public void addTail(Node<K, V> node){
            node.prev = tail.prev;
            node.next = tail;
            tail.prev.next = node;
            tail.prev = node;
            size ++;
        }

        // 获取最久未使用节点
        public Node<K, V> getLast() {
            return head.next;
        }
    }

    // key:key, value:Node节点
    Map<Integer, Node<Integer, Integer>> keyTable;
    // key:访问次数, value:访问次数相同的组成链表,头是最久未访问的,新的插到尾部
    Map<Integer, DoubleLinkedList<Integer, Integer>> countTable;
    int capacity;
    int minCount;

    public LFUCache2(int capacity) {
        this.capacity = capacity;
        keyTable = new HashMap<>();
        countTable = new HashMap<>();
    }

    public int get(int key) {
        if (!keyTable.containsKey(key)){
            return -1;
        }
        Node<Integer, Integer> node = keyTable.get(key);
        resetNode(node);
        return node.value;
    }

    public void put(int key, int value) {
        if (keyTable.containsKey(key)){
            // 存在,则改变值,访问次数+1, 重置节点
            Node<Integer, Integer> node = keyTable.get(key);
            resetNode(node);
            node.value = value;
        }else {
            // 容量已满,剔除最少访问节点
            if (capacity == keyTable.size()){
                // 通过minCount拿到最小访问的头节点(最久未访问)
                Node<Integer, Integer> node = countTable.get(minCount).getLast();
                keyTable.remove(node.key);
                countTable.get(minCount).removeNode(node);
                if (countTable.get(minCount).size == 0) {
                    countTable.remove(minCount);
                }
            }
            // 新节点添加
            DoubleLinkedList<Integer,Integer> linkedList = countTable.getOrDefault(1, new DoubleLinkedList());
            Node<Integer, Integer> node = new Node<>(key, value);
            linkedList.addTail(node);
            countTable.put(1, linkedList);
            keyTable.put(key, node);
            minCount = 1;
        }
    }

    /**
     * 访问次数+1,重置节点在countTable的位置
     * @param node
     */
    public void resetNode(Node<Integer, Integer> node){
        // 1. 原位置删除该节点,原位置链表为空,则删除
        int count = node.count;
        countTable.get(count).removeNode(node);
        if (countTable.get(count).size == 0){
            countTable.remove(count);
            if (count == minCount) {
                minCount ++;
            }
        }
        // 2. 访问次数+1
        node.count ++;
        count++;
        // 3. 新位置为空,则创建链表,节点添加进去
        DoubleLinkedList<Integer, Integer> nextLinkedList = countTable.getOrDefault(count, new DoubleLinkedList<>());
        nextLinkedList.addTail(node);
        countTable.put(count, nextLinkedList);
    }

}
;