玩命加载中 . . .

460-LFU缓存


LeetCode 460. LFU 缓存

请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。

实现 LFUCache 类:

  • LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象
  • int get(int key) - 如果键 key 存在于缓存中,则获取键的值,否则返回 -1 。
  • void put(int key, int value) - 如果键 key 已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量 capacity 时,则应该在插入新项之前,移除最不经常使用的项。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。
    为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。

当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 getput 操作,使用计数器的值将会递增。

函数 getput 必须以 $O(1)$ 的平均时间复杂度运行。

示例:

输入:
["LFUCache", "put", "put", "get", "put", "get", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]

解释:
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lfu = new LFUCache(2);
lfu.put(1, 1);   // cache=[1,_], cnt(1)=1
lfu.put(2, 2);   // cache=[2,1], cnt(2)=1, cnt(1)=1
lfu.get(1);      // 返回 1
                 // cache=[1,2], cnt(2)=1, cnt(1)=2
lfu.put(3, 3);   // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
                 // cache=[3,1], cnt(3)=1, cnt(1)=2
lfu.get(2);      // 返回 -1(未找到)
lfu.get(3);      // 返回 3
                 // cache=[3,1], cnt(3)=2, cnt(1)=2
lfu.put(4, 4);   // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
                 // cache=[4,3], cnt(4)=1, cnt(3)=2
lfu.get(1);      // 返回 -1(未找到)
lfu.get(3);      // 返回 3
                 // cache=[3,4], cnt(4)=1, cnt(3)=3
lfu.get(4);      // 返回 4
                 // cache=[3,4], cnt(4)=2, cnt(3)=3

method 1: 哈希表+平衡二叉树

平衡二叉树里面按访问次数和时间存储节点值,通过key从哈希表里面找到对应的节点值,获取节点并更新

struct Node {
    int key, val;
    int cnt, time;
    Node() {}
    Node(int c, int t, int k, int v): cnt(c), time(t), key(k), val(v) {}
    bool operator< (const Node& lhs) const {
        if (cnt == lhs.cnt) return time < lhs.time;
        return cnt < lhs.cnt;
    }
};

class LFUCache {
public:
    unordered_map<int, Node> hash;
    set<Node> S;
    int time, capacity;
    LFUCache(int capacity): time(0), capacity(capacity) {
        hash.clear();
        S.clear();
    }
    
    int get(int key) {
        if (capacity == 0) return -1;
        if (hash.find(key) != hash.end()) {
            Node cache = hash[key];
            S.erase(cache);
            cache.cnt++;
            cache.time = ++time;
            hash[key] = cache;
            S.insert(cache);
            return cache.val;
        }
        return -1;
    }
    
    void put(int key, int value) {
        if (capacity == 0) return;
        if (hash.find(key) == hash.end()) {
            if (hash.size() == capacity) {
                hash.erase(S.begin()->key);
                S.erase(S.begin());
            }
            Node cache = Node(1, ++time, key, value);
            hash[key] = cache;
            S.insert(cache);
        }
        else {
            Node cache = hash[key];
            S.erase(cache);
            cache.cnt++;
            cache.time = ++time;
            cache.val = value;
            hash[key] = cache;
            S.insert(cache);
        }
    }
};

时间复杂度:getput的时间复杂度是$O(logn)$,因为要从平衡二叉树中查找和删除节点
空间复杂度:$O(capacity)$

method 2: 双哈希表

freq_table哈希表里面存储拥有相同访问次数的节点,形成链表,每次从头部插入新节点,所以,尾节点就是相同频率时的最久未访问的节点,删除之

key_table哈希表存储key所对应的链表中的节点的迭代器,这样可以取得对应key的节点并更新

更新的时候,要把节点的freq+1,所以要把节点移动到freq+1这条链表上

struct Node {
    int key, val;
    int freq;
    Node() {}
    Node(int f, int k, int v): freq(f), key(k), val(v) {}
};

class LFUCache {
public:
    unordered_map<int, list<Node>> freq_table;
    unordered_map<int, list<Node>::iterator> key_table;
    int capacity;
    int minfreq;    // 保存最小频率,以获取要删除的节点
    LFUCache(int capacity): capacity(capacity), minfreq(0) {
        freq_table.clear();
        key_table.clear();
    }
    
    int get(int key) {
        if (capacity == 0) return -1;
        if (key_table.find(key) != key_table.end()) {
            auto it = key_table[key];
            int freq = it->freq;
            int value = it->val;
            freq_table[freq].erase(it);
            if (freq_table[freq].size() == 0) {
                freq_table.erase(freq);
                if (minfreq == freq) minfreq += 1;
            }
            freq_table[freq + 1].push_front(Node(freq + 1, key, value));
            key_table[key] = freq_table[freq + 1].begin();
            return value;
        }
        return -1;
    }
    
    void put(int key, int value) {
        if (capacity == 0) return;
        if (key_table.find(key) == key_table.end()) {
            if (key_table.size() == capacity) {
                Node node = freq_table[minfreq].back();
                key_table.erase(node.key);
                freq_table[minfreq].pop_back();
                if (freq_table[minfreq].size() == 0) {
                    freq_table.erase(minfreq);
                }
            }
            freq_table[1].push_front(Node(1, key, value));
            key_table[key] = freq_table[1].begin();
            minfreq = 1;
        } else {    // 更新value和移动,这里是直接删掉,重新插入一个值为value的节点
            auto it = key_table[key];
            int freq = it->freq;
            freq_table[freq].erase(it);
            if (freq_table[freq].size() == 0) {
                freq_table.erase(freq);
                if (minfreq == freq) minfreq += 1;
            }
            freq_table[freq + 1].push_front(Node(freq + 1, key, value));
            key_table[key] = freq_table[freq + 1].begin();
        }
    }
};

时间复杂度:getput的时间复杂度是$O(logn)$,因为要从平衡二叉树中查找和删除节点
空间复杂度:$O(capacity)$


文章作者: kunpeng
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 kunpeng !
  目录