国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

科普 | 你應(yīng)該知道的Java緩存進(jìn)化史

開發(fā) 后端
本文主要講述愛奇藝的緩存之路和本地緩存的一個(gè)發(fā)展歷史,以及每一種緩存的實(shí)現(xiàn)基本原理。

[[241179]]

背景

本文是上周去技術(shù)沙龍聽了一下愛奇藝的 Java 緩存之路有感寫出來的。先簡(jiǎn)單介紹一下愛奇藝的 Java 緩存道路的發(fā)展吧。

可以看見圖中分為幾個(gè)階段:

  • 第一階段:數(shù)據(jù)同步加 Redis

通過消息隊(duì)列進(jìn)行數(shù)據(jù)同步至 Redis,然后 Java 應(yīng)用直接去取緩存。這個(gè)階段的優(yōu)點(diǎn)是:由于是使用的分布式緩存,所以數(shù)據(jù)更新快。缺點(diǎn)也比較明顯:依賴 Redis 的穩(wěn)定性,一旦 Redis 掛了,整個(gè)緩存系統(tǒng)不可用,造成緩存雪崩,所有請(qǐng)求打到 DB。

  • 第二,三階段:JavaMap 到 Guava Cache

這個(gè)階段使用進(jìn)程內(nèi)緩存作為一級(jí)緩存,Redis 作為二級(jí)。優(yōu)點(diǎn):不受外部系統(tǒng)影響,其他系統(tǒng)掛了,依然能使用。缺點(diǎn):進(jìn)程內(nèi)緩存無法像分布式緩存那樣做到實(shí)時(shí)更新。由于 Java 內(nèi)存有限,必定緩存得設(shè)置大小,然后有些緩存會(huì)被淘汰,就會(huì)有命中率的問題。

  • 第四階段: Guava Cache 刷新

為了解決上面的問題,利用 Guava Cache 可以設(shè)置寫后刷新時(shí)間,進(jìn)行刷新。解決了一直不更新的問題,但是依然沒有解決實(shí)時(shí)刷新。

  • 第五階段:外部緩存異步刷新

這個(gè)階段擴(kuò)展了 Guava Cache,利用 Redis 作為消息隊(duì)列通知機(jī)制,通知其他 Java 應(yīng)用程序進(jìn)行刷新。

這里簡(jiǎn)單介紹一下愛奇藝緩存發(fā)展的五個(gè)階段,當(dāng)然還有一些其他的優(yōu)化,比如 GC 調(diào)優(yōu),緩存穿透,緩存覆蓋的一些優(yōu)化等等。

原始社會(huì) - 查庫

上面說的是愛奇藝的一個(gè)進(jìn)化線路,但是在大家的一般開發(fā)過程中,第一步一般都沒有 Redis,而是直接查庫。

在流量不大的時(shí)候,查數(shù)據(jù)庫或者讀取文件最為方便,也能完全滿足我們的業(yè)務(wù)要求。

古代社會(huì) - HashMap

當(dāng)我們應(yīng)用有一定流量之后或者查詢數(shù)據(jù)庫特別頻繁,這個(gè)時(shí)候就可以祭出我們 Java 中自帶的 HashMap 或者 ConcurrentHashMap。我們可以在代碼中這么寫:

  1. public class CustomerService { 
  2.     private HashMap<String,String> hashMap = new HashMap<>(); 
  3.     private CustomerMapper customerMapper; 
  4.     public String getCustomer(String name){ 
  5.         String customer = hashMap.get(name); 
  6.         if ( customer == null){ 
  7.             customer = customerMapper.get(name); 
  8.             hashMap.put(name,customer); 
  9.         } 
  10.         return customer; 
  11.     } 

但是這樣做就有個(gè)問題 HashMap 無法進(jìn)行數(shù)據(jù)淘汰,內(nèi)存會(huì)無限制的增長(zhǎng),所以 HashMap 很快也被淘汰了。

當(dāng)然并不是說它完全就沒用,就像我們古代社會(huì)也不是所有的東西都是過時(shí)的,比如我們中華名族的傳統(tǒng)美德是永不過時(shí)的,就像這個(gè) HashMap 一樣的可以在某些場(chǎng)景下作為緩存,當(dāng)不需要淘汰機(jī)制的時(shí)候,比如我們利用反射,如果我們每次都通過反射去搜索 Method,field,性能必定低效,這時(shí)我們用 HashMap 將其緩存起來,性能能提升很多。

近代社會(huì) - LRUHashMap

在古代社會(huì)中難住我們的問題是無法進(jìn)行數(shù)據(jù)淘汰,這樣會(huì)導(dǎo)致我們內(nèi)存無限膨脹,顯然我們是不可以接受的。

有人就說我把一些數(shù)據(jù)給淘汰掉唄,這樣不就對(duì)了,但是怎么淘汰呢?隨機(jī)淘汰嗎?當(dāng)然不行,試想一下你剛把 A 裝載進(jìn)緩存,下一次要訪問的時(shí)候就被淘汰了,那又會(huì)訪問我們的數(shù)據(jù)庫了,那我們要緩存干嘛呢?

所以聰明的人們就發(fā)明了幾種淘汰算法,下面列舉下常見的三種 FIFO,LRU,LFU(還有一些 ARC,MRU 感興趣的可以自行搜索):

  • FIFO:先進(jìn)先出,在這種淘汰算法中,先進(jìn)入緩存的會(huì)先被淘汰。

這種可謂是最簡(jiǎn)單的了,但是會(huì)導(dǎo)致我們命中率很低。試想一下我們?nèi)绻袀€(gè)訪問頻率很高的數(shù)據(jù)是所有數(shù)據(jù)第一個(gè)訪問的,而那些不是很高的是后面再訪問的,那這樣就會(huì)把我們的首個(gè)數(shù)據(jù)但是他的訪問頻率很高給擠出。

  • LRU:最近最少使用算法。

在這種算法中避免了上面的問題,每次訪問數(shù)據(jù)都會(huì)將其放在我們的隊(duì)尾,如果需要淘汰數(shù)據(jù),就只需要淘汰隊(duì)首即可。

但是這個(gè)依然有個(gè)問題,如果有個(gè)數(shù)據(jù)在 1 個(gè)小時(shí)的前 59 分鐘訪問了 1 萬次(可見這是個(gè)熱點(diǎn)數(shù)據(jù)),再后 1 分鐘沒有訪問這個(gè)數(shù)據(jù),但是有其他的數(shù)據(jù)訪問,就導(dǎo)致了我們這個(gè)熱點(diǎn)數(shù)據(jù)被淘汰。

  • LFU:最近最少頻率使用。

在這種算法中又對(duì)上面進(jìn)行了優(yōu)化,利用額外的空間記錄每個(gè)數(shù)據(jù)的使用頻率,然后選出頻率最低進(jìn)行淘汰。這樣就避免了 LRU 不能處理時(shí)間段的問題。

上面列舉了三種淘汰策略,對(duì)于這三種,實(shí)現(xiàn)成本是一個(gè)比一個(gè)高,同樣的命中率也是一個(gè)比一個(gè)好。

而我們一般來說選擇的方案居中即可,即實(shí)現(xiàn)成本不是太高,而命中率也還行的 LRU,如何實(shí)現(xiàn)一個(gè) LRUMap 呢?我們可以通過繼承 LinkedHashMap,重寫 removeEldestEntry 方法,即可完成一個(gè)簡(jiǎn)單的 LRUMap。

  1. ​class LRUMap extends LinkedHashMap { 
  2.         private final int max
  3.         private Object lock; 
  4.         public LRUMap(int max, Object lock) { 
  5.             //無需擴(kuò)容 
  6.             super((int) (max * 1.4f), 0.75f, true); 
  7.             this.max = max
  8.             this.lock = lock; 
  9.         } 
  10.         /** 
  11.          * 重寫LinkedHashMap的removeEldestEntry方法即可 
  12.          * 在Put的時(shí)候判斷,如果為true,就會(huì)刪除最老的 
  13.          * @param eldest 
  14.          * @return 
  15.          */ 
  16.         @Override 
  17.         protected boolean removeEldestEntry(Map.Entry eldest) { 
  18.             return size() > max
  19.         } 
  20.         public Object getValue(Object key) { 
  21.             synchronized (lock) { 
  22.                 return get(key); 
  23.             } 
  24.         } 
  25.         public void putValue(Object key, Object value) { 
  26.             synchronized (lock) { 
  27.                 put(key, value); 
  28.             } 
  29.         } 
  30.         public boolean removeValue(Object key) { 
  31.             synchronized (lock) { 
  32.                 return remove(key) != null
  33.             } 
  34.         } 
  35.         public boolean removeAll(){ 
  36.             clear(); 
  37.             return true
  38.         } 
  39.     } 

在 LinkedHashMap 中維護(hù)了一個(gè) entry(用來放 key 和 value 的對(duì)象)鏈表。在每一次 get 或者 put 的時(shí)候都會(huì)把插入的新 entry,或查詢到的老 entry 放在我們鏈表末尾。 

可以注意到我們?cè)跇?gòu)造方法中,設(shè)置的大小特意設(shè)置到 max*1.4,在下面的 removeEldestEntry 方法中只需要 size>max 就淘汰,這樣我們這個(gè) map 永遠(yuǎn)也走不到擴(kuò)容的邏輯了,通過重寫 LinkedHashMap,幾個(gè)簡(jiǎn)單的方法我們實(shí)現(xiàn)了我們的 LruMap。

現(xiàn)代社會(huì) - Guava Cache

在近代社會(huì)中已經(jīng)發(fā)明出來了 LRUMap,用來進(jìn)行緩存數(shù)據(jù)的淘汰,但是有幾個(gè)問題:

  • 鎖競(jìng)爭(zhēng)嚴(yán)重,可以看見我的代碼中,Lock 是全局鎖,在方法級(jí)別上面的,當(dāng)調(diào)用量較大時(shí),性能必然會(huì)比較低。
  • 不支持過期時(shí)間
  • 不支持自動(dòng)刷新

所以谷歌的大佬們對(duì)于這些問題,按捺不住了,發(fā)明了 Guava Cache,在 Guava Cache 中你可以如下面的代碼一樣,輕松使用:

  1. public static void main(String[] args) throws ExecutionException { 
  2.         LoadingCache<String, String> cache = CacheBuilder.newBuilder() 
  3.                 .maximumSize(100) 
  4.                 //寫之后30ms過期 
  5.                 .expireAfterWrite(30L, TimeUnit.MILLISECONDS) 
  6.                 //訪問之后30ms過期 
  7.                 .expireAfterAccess(30L, TimeUnit.MILLISECONDS) 
  8.                 //20ms之后刷新 
  9.                 .refreshAfterWrite(20L, TimeUnit.MILLISECONDS) 
  10.                 //開啟weakKey key 當(dāng)啟動(dòng)垃圾回收時(shí),該緩存也被回收 
  11.                 .weakKeys() 
  12.                 .build(createCacheLoader()); 
  13.         System.out.println(cache.get("hello")); 
  14.         cache.put("hello1""我是hello1"); 
  15.         System.out.println(cache.get("hello1")); 
  16.         cache.put("hello1""我是hello2"); 
  17.         System.out.println(cache.get("hello1")); 
  18.     } 
  19.     public static com.google.common.cache.CacheLoader<String, String> createCacheLoader() { 
  20.         return new com.google.common.cache.CacheLoader<String, String>() { 
  21.             @Override 
  22.             public String load(String key) throws Exception { 
  23.                 return key
  24.             } 
  25.         }; 
  26.     } 

我將會(huì)從 Guava Cache 原理中,解釋 Guava Cache 是如何解決 LRUMap 的幾個(gè)問題的。

鎖競(jìng)爭(zhēng)

Guava Cache 采用了類似 ConcurrentHashMap 的思想,分段加鎖,在每個(gè)段里面各自負(fù)責(zé)自己的淘汰的事情。

在 Guava 根據(jù)一定的算法進(jìn)行分段,這里要說明的是,如果段太少那競(jìng)爭(zhēng)依然很嚴(yán)重,如果段太多容易出現(xiàn)隨機(jī)淘汰,比如大小為 100 的,給他分 100 個(gè)段,那也就是讓每個(gè)數(shù)據(jù)都獨(dú)占一個(gè)段,而每個(gè)段會(huì)自己處理淘汰的過程,所以會(huì)出現(xiàn)隨機(jī)淘汰。在 Guava Cache 中通過如下代碼,計(jì)算出應(yīng)該如何分段。

  1. int segmentShift = 0; 
  2.     int segmentCount = 1; 
  3.     while (segmentCount < concurrencyLevel && (!evictsBySize() || segmentCount * 20 <= maxWeight)) { 
  4.       ++segmentShift; 
  5.       segmentCount <<= 1; 
  6.     } 

上面 segmentCount 就是我們最后的分段數(shù),其保證了每個(gè)段至少 10 個(gè) entry。如果沒有設(shè)置 concurrencyLevel 這個(gè)參數(shù),那么默認(rèn)就會(huì)是 4,最后分段數(shù)也最多為 4,例如我們 size 為 100,會(huì)分為 4 段,每段最大的 size 是 25。

在 Guava Cache 中對(duì)于寫操作直接加鎖,對(duì)于讀操作,如果讀取的數(shù)據(jù)沒有過期,且已經(jīng)加載就緒,不需要進(jìn)行加鎖,如果沒有讀到會(huì)再次加鎖進(jìn)行二次讀,如果還沒有需要進(jìn)行緩存加載,也就是通過我們配置的 CacheLoader,我這里配置的是直接返回 Key,在業(yè)務(wù)中通常配置從數(shù)據(jù)庫中查詢。 如下圖所示:

過期時(shí)間

相比于 LRUMap 多了兩種過期時(shí)間,一個(gè)是寫后多久過期 expireAfterWrite,一個(gè)是讀后多久過期 expireAfterAccess。

很有意思的事情是,在 Guava Cache 中對(duì)于過期的 entry 并沒有馬上過期(也就是并沒有后臺(tái)線程一直在掃),而是通過進(jìn)行讀寫操作的時(shí)候進(jìn)行過期處理,這樣做的好處是避免后臺(tái)線程掃描的時(shí)候進(jìn)行全局加鎖。看下面的代碼:

  1. public static void main(String[] args) throws ExecutionException, InterruptedException { 
  2.         Cache<String, String> cache = CacheBuilder.newBuilder() 
  3.                 .maximumSize(100) 
  4.                 //寫之后5s過期 
  5.                 .expireAfterWrite(5, TimeUnit.MILLISECONDS) 
  6.                 .concurrencyLevel(1) 
  7.                 .build(); 
  8.         cache.put("hello1""我是hello1"); 
  9.         cache.put("hello2""我是hello2"); 
  10.         cache.put("hello3""我是hello3"); 
  11.         cache.put("hello4""我是hello4"); 
  12.         //至少睡眠5ms 
  13.         Thread.sleep(5); 
  14.         System.out.println(cache.size()); 
  15.         cache.put("hello5""我是hello5"); 
  16.         System.out.println(cache.size()); 
  17.     } 
  18. 輸出: 
  19. 4  

從這個(gè)結(jié)果中我們知道,在 put 的時(shí)候才進(jìn)行的過期處理。特別注意的是我上面 concurrencyLevel(1)這里將分段最大設(shè)置為 1,不然不會(huì)出現(xiàn)這個(gè)實(shí)驗(yàn)效果的,在上面一節(jié)中已經(jīng)說過,我們是以段位單位進(jìn)行過期處理。在每個(gè) Segment 中維護(hù)了兩個(gè)隊(duì)列:

  1. final Queue<ReferenceEntry<K, V>> writeQueue; 
  2.     final Queue<ReferenceEntry<K, V>> accessQueue; 

writeQueue 維護(hù)了寫隊(duì)列,隊(duì)頭代表著寫得早的數(shù)據(jù),隊(duì)尾代表寫得晚的數(shù)據(jù)。accessQueue 維護(hù)了訪問隊(duì)列,和 LRU 一樣,用來進(jìn)行訪問時(shí)間的淘汰。如果當(dāng)這個(gè) Segment 超過最大容量,比如我們上面所說的 25,超過之后,就會(huì)把 accessQueue 這個(gè)隊(duì)列的第一個(gè)元素進(jìn)行淘汰。

  1. void expireEntries(long now) { 
  2.       drainRecencyQueue(); 
  3.       ReferenceEntry<K, V> e; 
  4.       while ((e = writeQueue.peek()) != null && map.isExpired(e, now)) { 
  5.         if (!removeEntry(e, e.getHash(), RemovalCause.EXPIRED)) { 
  6.           throw new AssertionError(); 
  7.         } 
  8.       } 
  9.       while ((e = accessQueue.peek()) != null && map.isExpired(e, now)) { 
  10.         if (!removeEntry(e, e.getHash(), RemovalCause.EXPIRED)) { 
  11.           throw new AssertionError(); 
  12.         } 
  13.       } 
  14.     } 

上面就是 Guava Cache 處理過期 entries 的過程,會(huì)對(duì)兩個(gè)隊(duì)列一次進(jìn)行 peek 操作,如果過期就進(jìn)行刪除。

一般處理過期 entries 可以在我們的 put 操作的前后,或者讀取數(shù)據(jù)時(shí)發(fā)現(xiàn)過期了,然后進(jìn)行整個(gè) segment 的過期處理,又或者進(jìn)行二次讀 lockedGetOrLoad 操作的時(shí)候調(diào)用。

  1. void evictEntries(ReferenceEntry<K, V> newest) { 
  2.       ///... 省略無用代碼 
  3.       while (totalWeight > maxSegmentWeight) { 
  4.         ReferenceEntry<K, V> e = getNextEvictable(); 
  5.         if (!removeEntry(e, e.getHash(), RemovalCause.SIZE)) { 
  6.           throw new AssertionError(); 
  7.         } 
  8.       } 
  9.     } 
  10. /** 
  11. **返回accessQueue的entry 
  12. **/ 
  13. ReferenceEntry<K, V> getNextEvictable() { 
  14.       for (ReferenceEntry<K, V> e : accessQueue) { 
  15.         int weight = e.getValueReference().getWeight(); 
  16.         if (weight > 0) { 
  17.           return e; 
  18.         } 
  19.       } 
  20.       throw new AssertionError(); 
  21.     } 

上面是我們驅(qū)逐 entry 的時(shí)候的代碼,可以看見訪問的是 accessQueue 對(duì)其隊(duì)頭進(jìn)行驅(qū)逐。而驅(qū)逐策略一般是在對(duì) segment 中的元素發(fā)生變化時(shí)進(jìn)行調(diào)用,比如插入操作,更新操作,加載數(shù)據(jù)操作。

自動(dòng)刷新

自動(dòng)刷新操作,在 Guava Cache 中實(shí)現(xiàn)相對(duì)比較簡(jiǎn)單,直接通過查詢,判斷其是否滿足刷新條件,進(jìn)行刷新。

其他特性

在 Guava Cache 中還有一些其他特性:

虛引用

在 Guava Cache 中,key 和 value 都能進(jìn)行虛引用的設(shè)定,在 segment 中有兩個(gè)引用隊(duì)列:

  1. final @Nullable ReferenceQueue<K> keyReferenceQueue; 
  2.    final @Nullable ReferenceQueue<V> valueReferenceQueue; 

這兩個(gè)隊(duì)列用來記錄被回收的引用,其中每個(gè)隊(duì)列記錄了每個(gè)被回收的 entry 的 hash,這樣回收了之后通過這個(gè)隊(duì)列中的 hash 值就能把以前的 entry 進(jìn)行刪除。

刪除監(jiān)聽器

在 Guava Cache 中,當(dāng)有數(shù)據(jù)被淘汰時(shí),但是你不知道他到底是過期,還是被驅(qū)逐,還是因?yàn)樘撘玫膶?duì)象被回收?

這個(gè)時(shí)候你可以調(diào)用這個(gè)方法 removalListener(RemovalListener listener)添加監(jiān)聽器進(jìn)行數(shù)據(jù)淘汰的監(jiān)聽,可以打日志或者一些其他處理,可以用來進(jìn)行數(shù)據(jù)淘汰分析。

在 RemovalCause 記錄了所有被淘汰的原因:被用戶刪除,被用戶替代,過期,驅(qū)逐收集,由于大小淘汰。

Guava Cache 的總結(jié)

細(xì)細(xì)品讀 Guava Cache 的源碼總結(jié)下來,其實(shí)就是一個(gè)性能不錯(cuò)的,api 豐富的 LRU Map。愛奇藝的緩存的發(fā)展也是基于此之上,通過對(duì) Guava Cache 的二次開發(fā),讓其可以進(jìn)行 Java 應(yīng)用服務(wù)之間的緩存更新。

走向未來-caffeine

Guava Cache 的功能的確是很強(qiáng)大,滿足了絕大多數(shù)人的需求,但是其本質(zhì)上還是 LRU 的一層封裝,所以在眾多其他較為優(yōu)良的淘汰算法中就相形見絀了。而 Caffeine Cache 實(shí)現(xiàn)了 W-TinyLFU(LFU+LRU 算法的變種)。下面是不同算法的命中率的比較:

其中 Optimal 是最理想的命中率,LRU 和其他算法相比的確是個(gè)弟弟。而我們的 W-TinyLFU 是最接近理想命中率的。當(dāng)然不僅僅是命中率 Caffeine 優(yōu)于了 Guava Cache,在讀寫吞吐量上面也是完爆 Guava Cache。 

這個(gè)時(shí)候你肯定會(huì)好奇為啥 Caffeine 這么牛逼呢?別著急下面慢慢給你道來。

W-TinyLFU

上面已經(jīng)說過了傳統(tǒng)的 LFU 是怎么一回事。在 LFU 中只要數(shù)據(jù)訪問模式的概率分布隨時(shí)間保持不變時(shí),其命中率就能變得非常高。

這里我還是拿愛奇藝舉例,比如有部新劇出來了,我們使用 LFU 給他緩存下來,這部新劇在這幾天大概訪問了幾億次,這個(gè)訪問頻率也在我們的 LFU 中記錄了幾億次。

但是新劇總會(huì)過氣的,比如一個(gè)月之后這個(gè)新劇的前幾集其實(shí)已經(jīng)過氣了,但是他的訪問量的確是太高了,其他的電視劇根本無法淘汰這個(gè)新劇,所以在這種模式下是有局限性。

所以各種 LFU 的變種出現(xiàn)了,基于時(shí)間周期進(jìn)行衰減,或者在最近某個(gè)時(shí)間段內(nèi)的頻率。同樣的 LFU 也會(huì)使用額外空間記錄每一個(gè)數(shù)據(jù)訪問的頻率,即使數(shù)據(jù)沒有在緩存中也需要記錄,所以需要維護(hù)的額外空間很大。

可以試想我們對(duì)這個(gè)維護(hù)空間建立一個(gè) HashMap,每個(gè)數(shù)據(jù)項(xiàng)都會(huì)存在這個(gè) HashMap 中,當(dāng)數(shù)據(jù)量特別大的時(shí)候,這個(gè) HashMap 也會(huì)特別大。

再回到 LRU,我們的 LRU 也不是那么一無是處,LRU 可以很好的應(yīng)對(duì)突發(fā)流量的情況,因?yàn)樗恍枰塾?jì)數(shù)據(jù)頻率。

所以 W-TinyLFU 結(jié)合了 LRU 和 LFU,以及其他的算法的一些特點(diǎn)。

頻率記錄

首先要說到的就是頻率記錄的問題,我們要實(shí)現(xiàn)的目標(biāo)是利用有限的空間可以記錄隨時(shí)間變化的訪問頻率。在 W-TinyLFU 中使用 Count-Min Sketch 記錄我們的訪問頻率,而這個(gè)也是布隆過濾器的一種變種。如下圖所示::

如果需要記錄一個(gè)值,那我們需要通過多種 hash 算法對(duì)其進(jìn)行處理hash,然后在對(duì)應(yīng)的 hash 算法的記錄中+1,為什么需要多種 hash 算法呢?

由于這是一個(gè)壓縮算法必定會(huì)出現(xiàn)沖突,比如我們建立一個(gè) Long 的數(shù)組,通過計(jì)算出每個(gè)數(shù)據(jù)的 hash 的位置。比如張三和李四,他們倆有可能 hash 值都是相同,比如都是 1 那 Long[1] 這個(gè)位置就會(huì)增加相應(yīng)的頻率,張三訪問 1 萬次,李四訪問 1 次那 Long[1] 這個(gè)位置就是 1 萬零 1。

如果取李四的訪問評(píng)率的時(shí)候就會(huì)取出是 1 萬零 1,但是李四命名只訪問了 1 次啊,為了解決這個(gè)問題,所以用了多個(gè) hash 算法可以理解為 Long[][] 二維數(shù)組的一個(gè)概念,比如在第一個(gè)算法張三和李四沖突了,但是在第二個(gè),第三個(gè)中很大的概率不沖突,比如一個(gè)算法大概有 1% 的概率沖突,那四個(gè)算法一起沖突的概率是 1% 的四次方。

通過這個(gè)模式,我們?nèi)±钏牡脑L問率的時(shí)候取所有算法中,李四訪問最低頻率的次數(shù)。所以他的名字叫 Count-Min Sketch。

這里和以前的做個(gè)對(duì)比,簡(jiǎn)單的舉個(gè)例子:如果一個(gè) HashMap 來記錄這個(gè)頻率,如果我有 100 個(gè)數(shù)據(jù),那這個(gè) HashMap 就得存儲(chǔ) 100 個(gè)這個(gè)數(shù)據(jù)的訪問頻率。

哪怕我這個(gè)緩存的容量是 1,因?yàn)?LFU 的規(guī)則我必須全部記錄這 100 個(gè)數(shù)據(jù)的訪問頻率。如果有更多的數(shù)據(jù)我就有記錄更多的。

在 Count-Min Sketch 中,我這里直接說 Caffeine 中的實(shí)現(xiàn)吧(在 FrequencySketch 這個(gè)類中),如果你的緩存大小是 100,他會(huì)生成一個(gè) Long 數(shù)組大小是和 100 最接近的 2 的冪的數(shù),也就是 128。

而這個(gè)數(shù)組將會(huì)記錄我們的訪問頻率。在 Caffeine 中它規(guī)則頻率最大為 15,15 的二進(jìn)制位 1111,總共是 4 位,而 Long 型是 64 位。所以每個(gè) Long 型可以放 16 種算法,但是 Caffeine 并沒有這么做,只用了四種 hash 算法,每個(gè) Long 型被分為四段,每段里面保存的是四個(gè)算法的頻率。

這樣做的好處是可以進(jìn)一步減少 hash 沖突,原先 128 大小的 hash,就變成了 128X4。

一個(gè)Long的結(jié)構(gòu)如下:

我們的 4 個(gè)段分為 A,B,C,D,在后面我也會(huì)這么叫它們。而每個(gè)段里面的四個(gè)算法我叫他 s1,s2,s3,s4。下面舉個(gè)例子,如果要添加一個(gè)訪問 50 的數(shù)字頻率應(yīng)該怎么做?我們這里用 size=100 來舉例。

  • 首先確定 50 這個(gè) hash 是在哪個(gè)段里面,通過 hash & 3 必定能獲得小于 4 的數(shù)字,假設(shè) hash & 3=0,那就在 A 段。
  • 對(duì) 50 的 hash 再用其他 hash 算法再做一次 hash,得到 Long 數(shù)組的位置。假設(shè)用 s1 算法得到 1,s2 算法得到 3,s3 算法得到 4,s4 算法得到 0。
  • 然后在 Long[1] 的 A 段里面的 s1 位置進(jìn)行+1,簡(jiǎn)稱 1As1 加 1,然后在 3As2 加 1,在 4As3 加 1,在 0As4 加 1。

這個(gè)時(shí)候有人會(huì)質(zhì)疑頻率最大為 15 的這個(gè)是否太小?沒關(guān)系在這個(gè)算法中,比如 size 等于 100,如果他全局提升了 1000 次就會(huì)全局除以 2 衰減,衰減之后也可以繼續(xù)增加,這個(gè)算法再 W-TinyLFU 的論文中證明了其可以較好的適應(yīng)時(shí)間段的訪問頻率。

讀寫性能

在 Guava Cache 中我們說過其讀寫操作中夾雜著過期時(shí)間的處理,也就是你在一次 put 操作中有可能還會(huì)做淘汰操作,所以其讀寫性能會(huì)受到一定影響。

可以看上面的圖中,Caffeine 的確在讀寫操作上面完爆 Guava Cache。主要是因?yàn)樵?Caffeine,對(duì)這些事件的操作是通過異步操作,它將事件提交至隊(duì)列,這里的隊(duì)列的數(shù)據(jù)結(jié)構(gòu)是 RingBuffer。

然后會(huì)通過默認(rèn)的 ForkJoinPool.commonPool(),或者自己配置線程池,進(jìn)行取隊(duì)列操作,然后在進(jìn)行后續(xù)的淘汰,過期操作。

當(dāng)然讀寫也是有不同的隊(duì)列,在 Caffeine 中認(rèn)為緩存讀比寫多很多,所以對(duì)于寫操作是所有線程共享一個(gè) Ringbuffer。

對(duì)于讀操作比寫操作更加頻繁,進(jìn)一步減少競(jìng)爭(zhēng),其為每個(gè)線程配備了一個(gè) RingBuffer:

 

數(shù)據(jù)淘汰策略

在 Caffeine 所有的數(shù)據(jù)都在 ConcurrentHashMap 中,這個(gè)和 Guava Cache 不同,Guava Cache 是自己實(shí)現(xiàn)了個(gè)類似 ConcurrentHashMap 的結(jié)構(gòu)。在 Caffeine 中有三個(gè)記錄引用的 LRU 隊(duì)列:

  • Eden 隊(duì)列:在 Caffeine 中規(guī)定只能為緩存容量的 %1,如果 size=100,那這個(gè)隊(duì)列的有效大小就等于 1。這個(gè)隊(duì)列中記錄的是新到的數(shù)據(jù),防止突發(fā)流量由于之前沒有訪問頻率,而導(dǎo)致被淘汰。

比如有一部新劇上線,在最開始其實(shí)是沒有訪問頻率的,防止上線之后被其他緩存淘汰出去,而加入這個(gè)區(qū)域。伊甸區(qū),最舒服最安逸的區(qū)域,在這里很難被其他數(shù)據(jù)淘汰。

  • Probation 隊(duì)列:叫做緩刑隊(duì)列,在這個(gè)隊(duì)列就代表你的數(shù)據(jù)相對(duì)比較冷,馬上就要被淘汰了。這個(gè)有效大小為 size 減去 eden 減去 protected。
  • Protected 隊(duì)列:在這個(gè)隊(duì)列中,可以稍微放心一下了,你暫時(shí)不會(huì)被淘汰,但是別急,如果 Probation 隊(duì)列沒有數(shù)據(jù)了或者 Protected 數(shù)據(jù)滿了,你也將會(huì)面臨淘汰的尷尬局面。

當(dāng)然想要變成這個(gè)隊(duì)列,需要把 Probation 訪問一次之后,就會(huì)提升為 Protected 隊(duì)列。這個(gè)有效大小為(size 減去 eden) X 80% 如果 size =100,就會(huì)是 79。

這三個(gè)隊(duì)列關(guān)系如下:

  • 所有的新數(shù)據(jù)都會(huì)進(jìn)入 Eden。
  • Eden 滿了,淘汰進(jìn)入 Probation。
  • 如果在 Probation 中訪問了其中某個(gè)數(shù)據(jù),則這個(gè)數(shù)據(jù)升級(jí)為 Protected。
  • 如果 Protected 滿了又會(huì)繼續(xù)降級(jí)為 Probation。

對(duì)于發(fā)生數(shù)據(jù)淘汰的時(shí)候,會(huì)從 Probation 中進(jìn)行淘汰,會(huì)把這個(gè)隊(duì)列中的數(shù)據(jù)隊(duì)頭稱為受害者,這個(gè)隊(duì)頭肯定是最早進(jìn)入的,按照 LRU 隊(duì)列的算法的話那它就應(yīng)該被淘汰,但是在這里只能叫它受害者,這個(gè)隊(duì)列是緩刑隊(duì)列,代表馬上要給它行刑了。

這里會(huì)取出隊(duì)尾叫候選者,也叫攻擊者。這里受害者會(huì)和攻擊者做 PK,通過我們的 Count-Min Sketch 中的記錄的頻率數(shù)據(jù)有以下幾個(gè)判斷:

  • 如果攻擊者大于受害者,那么受害者就直接被淘汰。
  • 如果攻擊者<=5,那么直接淘汰攻擊者。這個(gè)邏輯在他的注釋中有解釋: 他認(rèn)為設(shè)置一個(gè)預(yù)熱的門檻會(huì)讓整體命中率更高。

  • 其他情況,隨機(jī)淘汰。

如何使用

對(duì)于熟悉 Guava 的玩家來說,如果擔(dān)心有切換成本,那么你就多慮了, Caffeine 的 api 借鑒了 Guava 的 api,可以發(fā)現(xiàn)其基本一模一樣。

  1. public static void main(String[] args) { 
  2.         Cache<String, String> cache = Caffeine.newBuilder() 
  3.                 .expireAfterWrite(1, TimeUnit.SECONDS) 
  4.                 .expireAfterAccess(1,TimeUnit.SECONDS) 
  5.                 .maximumSize(10) 
  6.                 .build(); 
  7.         cache.put("hello","hello"); 
  8.     } 

順便一提的是,越來越多的開源框架都放棄了 Guava Cache,比如 Spring5。在業(yè)務(wù)上我也曾經(jīng)比較過 Guava Cache 和 Caffeine,最終選擇了 Caffeine,在線上也有不錯(cuò)的效果。所以不用擔(dān)心 Caffeine 不成熟,沒人使用。

最后

本文主要講述愛奇藝的緩存之路和本地緩存的一個(gè)發(fā)展歷史(從古至今到未來),以及每一種緩存的實(shí)現(xiàn)基本原理。

當(dāng)然要使用好緩存光是這些遠(yuǎn)遠(yuǎn)不夠,比如本地緩存如何在其他地方更改了之后同步更新,分布式緩存,多級(jí)緩存等等。后面也會(huì)專門寫一節(jié)介紹這個(gè)如何用好緩存。

對(duì)于 Guava Cache 和 Caffeine 的原理后面也會(huì)專門抽出時(shí)間寫這兩個(gè)的源碼分析,如果感興趣的朋友可以關(guān)注公眾號(hào)第一時(shí)間查閱更新文章。

 

責(zé)任編輯:武曉燕 來源: 咖啡拿鐵公眾號(hào)
相關(guān)推薦

2019-06-19 15:54:12

Redis緩存內(nèi)存

2021-01-06 11:38:15

區(qū)塊鏈信息化技術(shù)

2018-08-28 09:42:21

緩存愛奇藝架構(gòu)

2014-09-01 16:29:34

2011-12-21 16:44:00

信息圖手機(jī)進(jìn)化史

2024-09-21 10:43:15

數(shù)據(jù)技術(shù)信息

2010-10-09 14:46:20

2018-03-23 12:20:25

數(shù)據(jù)中心網(wǎng)絡(luò)數(shù)據(jù)

2011-09-01 09:34:21

架構(gòu)

2011-11-03 15:25:07

Android

2011-11-29 09:54:20

Google進(jìn)化史

2010-07-27 14:04:52

2012-11-20 09:30:47

2016-02-04 09:17:59

2022-03-25 14:01:20

元宇宙虛擬世界進(jìn)化

2023-11-27 09:23:19

2013-06-24 09:18:05

2010-01-21 16:08:26

C++語言

2010-04-07 14:54:20

Unix操作系統(tǒng)

2023-05-04 16:10:13

緩存前端
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

91精品成人久久| 欧美大胆a视频| 丁香婷婷自拍| 日本色综合中文字幕| 国产精品999999| 国产精品tv| 一区二区三欧美| 亚洲涩涩在线| 亚洲精品mp4| 50度灰在线| 日韩欧美综合一区| 亚洲夜夜综合| 亚洲福利在线播放| 国产资源在线观看入口av| 亚洲成人网在线| 98色花堂精品视频在线观看| 亚洲аv电影天堂网| 日本中文字幕中出在线| 欧美一级生活片| 污视频网站在线免费| 欧美一区二区性放荡片| 午夜成年人在线免费视频| 日韩欧美中文字幕制服| 3d玉蒲团在线观看| 亚洲福利视频久久| 女人高潮被爽到呻吟在线观看| 亚洲激情免费观看| 日本综合字幕| 日韩视频永久免费观看| 试看120秒一区二区三区| 欧美激情国产精品| 久久99性xxx老妇胖精品| 国产精品九九久久久久久久| 色狮一区二区三区四区视频| 97久久天天综合色天天综合色hd| 国产精品magnet| 亚洲人成人77777线观看| 国产成人综合视频| www.国产区| 亚洲综合视频网| 成年人视频在线看| 亚洲精品aⅴ中文字幕乱码| 综合欧美精品| 国产美女主播一区| 久久裸体视频| 99视频在线免费播放| 亚洲婷婷在线视频| 成人影院免费观看| 日韩国产一区三区| 粉嫩精品导航导航| 国产精品三区www17con| 精品中文字幕一区二区小辣椒| 免费大片在线观看| 91黄色免费版| freexxx性亚洲精品| 欧美久久精品午夜青青大伊人| 欧美伦理在线视频| 亚洲在线色站| 日本一区二区综合亚洲| 第一视频专区在线| 主播福利视频一区| 久久久久国产精品| 欧美黑人在线观看| 亚洲国产精品自拍| 国产偷倩在线播放| 欧美在线免费视频| 日韩精品免费视频人成| 艹b视频在线观看| 欧美军同video69gay| 国产亚洲高清一区| 国产精品裸体一区二区三区| 国产91在线|亚洲| 蜜桃免费在线| 久久综合久久八八| 亚洲大胆av| 不卡av免费在线| 日韩西西人体444www| 校花撩起jk露出白色内裤国产精品| 欧美中日韩免费视频| 中文字幕中文在线不卡住| 欧美伦理免费在线| 国产精品入口免费视| 成人小视频免费在线观看| 日韩精品系列| 欧美大肥婆大肥bbbbb| 首页综合国产亚洲丝袜| 97在线观看免费观看| 正在播放欧美一区| 亚洲女优在线| 小香蕉视频在线| 欧美激情亚洲激情| 久久电影国产免费久久电影| 日本精品视频| 国产一级特黄a大片99| 91久色porny| 丁香花电影在线观看完整版| 国产精品2018| 99久久精品情趣| 色婷婷视频在线观看| 国产精品大陆在线观看| jiyouzz国产精品久久| 99自拍视频在线观看| 国产精品美女在线观看| 国产日韩欧美制服另类| 欧美香蕉视频| 免费亚洲精品视频| 色94色欧美sute亚洲线路二| 欧洲亚洲一区二区三区| 欧美视频第一区| 国产一区二区三区日韩欧美| 久久一区国产| 欧美成年黄网站色视频| 91视频免费网站| 国产精品美女www爽爽爽| 国产亚洲欧美日韩精品一区二区三区 | 成人激情视频免费在线| 国产精品青草综合久久久久99| 成人软件在线观看| 亚洲高清视频在线观看| 欧美日韩免费高清一区色橹橹| 亚洲字幕久久| 伊人网在线视频| 国产欧美一区二区三区久久| 亚洲欧美日韩小说| 亚州av一区| 免费全黄无遮挡裸体毛片| 欧美激情第6页| 欧美国产一区二区| 国产一区丝袜| 天堂av免费观看| 成人观看高清在线观看免费| 欧美日韩性生活视频| 国产精品草草| 97caopor国产在线视频| 午夜精品视频在线观看一区二区| 精品av综合导航| 国产一区二区不卡老阿姨| 中文一区一区三区高中清不卡免费| 精品久久免费观看| 色七七影院综合| 欧美国产日本视频| 久久97视频| av电影在线观看| 亚洲图片欧洲图片日韩av| 亚洲欧美综合另类中字| 91碰在线视频| 国产精品x8x8一区二区| 香蕉视频在线观看免费| 国偷自产av一区二区三区小尤奈| 欧美一区二区私人影院日本| 国产老妇另类xxxxx| 美女精品久久| 久草在线新视觉| 日本高清不卡一区二区三| 这里只有精品视频在线| 久久久久国产精品麻豆| 精品一区二区三区在线| 欧美13一16娇小xxxx| 影音先锋成人资源网站| 97精品国产97久久久久久春色| 亚洲一区成人在线| 亚洲精品小说| 美女网站在线看| 欧美三级午夜理伦三级富婆| 91在线看www| 精品五月天久久| 日韩一区欧美小说| 亚洲视频播放| 视频欧美一区| 91高清在线| 成人在线看视频| 亚洲一区二区三区乱码aⅴ蜜桃女 亚洲一区二区三区乱码aⅴ | 亚洲三级在线免费| 亚洲午夜91| 暖暖成人免费视频| 肥女人的一级毛片| 久久国产精品99久久久久久丝袜| 亚洲欧洲一区二区三区久久| 亚洲综合色成人| 日产欧产美韩系列久久99| 亚洲伊人精品酒店| 在线观看av片| 一本大道东京热无码aⅴ| 国产精品揄拍一区二区| 精品久久久久久综合日本欧美| 国产片一区二区| 国产欧美短视频| 91精品网站在线观看| 在线观看a视频| 欧美黄色一级片视频| 激情伦成人综合小说| 欧美激情精品久久久久久蜜臀| 91麻豆精品国产| 亚洲精品免费看| 国产中文一区二区三区| 欧美搞黄网站| 卡一精品卡二卡三网站乱码| 久草在线资源站资源站| 中文字幕在线视频免费观看| 中国丰满人妻videoshd|