国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

微軟提出LLM-dCache:GTP驅動本地數(shù)據(jù)緩存優(yōu)化的大模型

發(fā)布于 2024-10-8 15:37
瀏覽
0收藏

微軟提出LLM-dCache:GTP驅動本地數(shù)據(jù)緩存優(yōu)化的大模型-AI.x社區(qū)

大型語言模型(LLM)在系統(tǒng)級優(yōu)化中的新進展

近年來,大型語言模型(LLM)在解決復雜問題的推理能力方面取得了顯著進展,使其能夠有效管理數(shù)千種工具和API調用。這些改進釋放了它們在大規(guī)模系統(tǒng)中的潛力,包括UI/網(wǎng)絡界面、移動應用程序、SQL后端和遠程感應平臺。這些用途通過需要集成各種API來加載、過濾、處理和跨多個時間和空間維度可視化數(shù)據(jù),體現(xiàn)了系統(tǒng)級的復雜性。

隨著Copilots規(guī)模的擴大,底層堆棧的開銷從云端點到本地執(zhí)行設備都在增加,這促使我們從根本上改變設計基于LLM的大規(guī)模系統(tǒng)和軟件的方式。然而,早期的系統(tǒng)優(yōu)化主要針對簡化的查詢或定義良好的基準,可能無法捕捉系統(tǒng)級任務模式和數(shù)據(jù)依賴性的細微差別。在現(xiàn)實的LLM工作負載中,數(shù)據(jù)顯示出顯著的可重用性。例如,一個地理空間分析師可能會問:“顯示加州紐波特海灘周圍的衛(wèi)星圖像。”隨后的提示是“現(xiàn)在,在這個區(qū)域檢測飛機”,這展示了一個數(shù)據(jù)元素被反復訪問的場景。

在這項工作中,我們從類似于CPU緩存系統(tǒng)中觀察到的時間和空間可重用性模式中汲取靈感,我們引入了LLM-dCache,一種GPT驅動的緩存策略,用于優(yōu)化LLM數(shù)據(jù)訪問模式。我們的關鍵直覺在于一種新穎的設計選擇,其中緩存管理無縫集成為LLM可用的工具之一,實現(xiàn)了與現(xiàn)有的函數(shù)調用機制和基線代理兼容的完全GPT驅動的即插即用方法,同時施加最小的開銷。通過在大規(guī)模地理空間平臺上的評估,我們證明了我們的方法在不同的GPT和提示技術中實現(xiàn)了LLM延遲的減少。我們希望這些發(fā)現(xiàn)能激勵進一步探索賦予LLM其他系統(tǒng)級優(yōu)化的可能性。

論文標題:LLM-dCache: Improving Tool-Augmented LLMs with GPT-Driven Localized Data Caching

機構:Microsoft Corporation, USA; Southern Illinois University, USA; University of Pittsburgh, USA

論文鏈接:https://arxiv.org/pdf/2406.06799.pdf

LLM-dCache的概念與設計動機

1. 從CPU緩存系統(tǒng)中獲取靈感

LLM-dCache的設計靈感來源于CPU緩存系統(tǒng),特別是其對時間和空間可重用性模式的利用。在CPU緩存中,頻繁訪問的數(shù)據(jù)被存儲在快速訪問的硬件中,以減少數(shù)據(jù)檢索時間和提高處理效率。類似地,LLM-dCache旨在通過緩存經(jīng)常被重新訪問的數(shù)據(jù)來優(yōu)化大型語言模型(LLM)的數(shù)據(jù)訪問模式,從而減少延遲并提高系統(tǒng)效率。

2. 針對大規(guī)模系統(tǒng)的緩存策略

在大規(guī)模系統(tǒng)中,如地理空間平臺,數(shù)據(jù)的重用性顯著,例如在連續(xù)的查詢中多次訪問相同的衛(wèi)星圖像數(shù)據(jù)。LLM-dCache通過將緩存操作集成為LLM可調用的API工具,使得緩存管理能夠無縫地融入到LLM的操作中。這種設計不僅適應了大規(guī)模數(shù)據(jù)處理的需求,還通過減少對主存儲的訪問需求,顯著提高了任務處理速度。

微軟提出LLM-dCache:GTP驅動本地數(shù)據(jù)緩存優(yōu)化的大模型-AI.x社區(qū)

緩存操作的集成與實現(xiàn)

1. 緩存讀取操作

在LLM-dCache中,緩存讀取操作被設計為GPT的一部分決策過程。當LLM接收到用戶查詢時,它會檢查當前的緩存內容,并決定是否執(zhí)行緩存加載工具。例如,如果用戶請求的數(shù)據(jù)已經(jīng)存在于緩存中,則LLM會直接從緩存中讀取數(shù)據(jù),而不是重新從數(shù)據(jù)庫或其他存儲系統(tǒng)加載。

2. 緩存更新策略

LLM-dCache采用最近最少使用(LRU)策略作為主要的緩存更新策略,并通過GPT來動態(tài)管理緩存更新。在每輪操作中,GPT根據(jù)當前的緩存狀態(tài)和新的數(shù)據(jù)加載操作,決定如何更新緩存。這種策略不僅優(yōu)化了緩存的使用效率,還減少了因緩存不命中而重新加載數(shù)據(jù)的需要。

3. GPT工具作為緩存操作的實現(xiàn)

將緩存功能作為GPT工具的一部分,簡化了緩存操作的實現(xiàn),并使其與平臺無關。這種方法不僅減少了需要進行的更改,還允許LLM自主管理緩存操作,從而在出現(xiàn)緩存未命中時,LLM可以重新評估其工具序列,以實時糾正工具選擇中的不準確性。這種動態(tài)適應性是系統(tǒng)優(yōu)化中的關鍵。

實驗設置與數(shù)據(jù)集

1. GeoLLM-Engine平臺介紹

GeoLLM-Engine是一個大規(guī)模的、可參數(shù)化的LLM引擎,專門用于處理地理空間任務。該平臺設計用于捕捉代理性能,配備了長期多工具LLM操作,這些操作需要頻繁地檢索和過濾數(shù)據(jù)。平臺還集成了一整套開源API、交互式地圖用戶界面、RAG和數(shù)據(jù)檢索工具,擁有超過110萬張衛(wèi)星圖像。

2. 數(shù)據(jù)集的構建與特點

為了測試GeoLLM-Engine的性能,我們擴展了GeoLLM-Engine采樣器以獲取GeoLLM-Engine-1k數(shù)據(jù)集的變體。通過調整采樣率參數(shù),并加入控制數(shù)據(jù)重用可能性的參數(shù),我們選擇性地采樣了80%概率需要已在緩存中的數(shù)據(jù)的提示,構建了一個包含1000個多步驟提示的測試數(shù)據(jù)集(總共約50000個工具調用)。此外,我們還準備了一個包含500個查詢的小型數(shù)據(jù)集用于分析。最后,我們使用模型檢查器模塊來驗證生成任務的功能正確性。

實驗結果與分析

1. 不同配置下的任務完成時間比較

根據(jù)實驗結果,LLM-dCache在不同配置下(包括GPT-4和GPT-3.5,以及Chain-of-Thought和ReAct技術,無論是少數(shù)樣本還是零樣本場景)平均能夠將任務完成時間提高1.24倍(表I)。這表明緩存策略不會降低輸出質量和代理的功能性,代理指標仍在既定的方差范圍內。

2. 緩存策略的有效性分析

通過對不同的緩存策略(LRU、LFU、RR和FIFO)進行分析,我們發(fā)現(xiàn)在數(shù)據(jù)重用率高的情況下,不同策略之間的延遲差異不明顯(表II頂部)。這表明數(shù)據(jù)重用模式而非模型選擇或提示策略是影響性能的主要因素。此外,我們還進行了多個小型驗證子集的分析,每個子集包含500個查詢,但具有不同的重用率,結果顯示更高的重用率與更大的延遲節(jié)省相關。

微軟提出LLM-dCache:GTP驅動本地數(shù)據(jù)緩存優(yōu)化的大模型-AI.x社區(qū)

通過將緩存操作作為GPT工具進行提示,我們的實驗顯示,GPT驅動的緩存操作在性能指標和延遲方面與程序化緩存操作非常接近,這證明了GPT成功執(zhí)行系統(tǒng)優(yōu)化任務的能力(表III)。這種方法展示了LLM在傳統(tǒng)程序化解決方案之外,指導緩存管理的多功能性和潛力。

微軟提出LLM-dCache:GTP驅動本地數(shù)據(jù)緩存優(yōu)化的大模型-AI.x社區(qū)

討論:GPT驅動的緩存操作與傳統(tǒng)編程實現(xiàn)的比較

1. GPT驅動的緩存操作

GPT驅動的緩存操作,如LLM-dCache所示,通過將緩存操作作為可調用的API工具暴露給GPT,使其能夠動態(tài)地讀取和更新緩存數(shù)據(jù)以響應用戶查詢。這種方法允許GPT在上下文提示的幫助下自主管理緩存操作,例如通過提示解釋LRU方案。這種集成方式使得緩存讀取和更新操作成為GPT的決策過程的一部分,從而只需很少的更改。此外,賦予LLM對緩存決策的自主權還能夠處理緩存未命中的情況:在功能調用失敗時,LLM會被提示重新評估其工具序列,就像處理任何其他工具選擇失誤一樣。

2. 傳統(tǒng)編程實現(xiàn)的緩存操作

傳統(tǒng)的編程實現(xiàn)緩存操作通常涉及直接在代碼中硬編碼緩存邏輯,如使用特定的緩存更新策略(LRU、LFU等)和緩存大小限制。這種方法在效率和可靠性方面可以達到很高的標準,因為它直接控制了所有的底層操作,但它缺乏靈活性,并且通常需要針對每個應用程序或系統(tǒng)進行定制。

3. 性能比較

根據(jù)研究,GPT驅動的緩存操作與傳統(tǒng)編程實現(xiàn)的緩存操作在性能指標和延遲方面非常相似,表明GPT能夠成功執(zhí)行系統(tǒng)優(yōu)化任務。例如,GPT驅動的變體在緩存“命中率”和延遲方面與完全編程方法相匹配,后者可以被視為效果和可靠性的上限。

限制與未來工作:擴展到更多系統(tǒng)級優(yōu)化和其他計算環(huán)境

1. 限制

當前的研究主要集中在云優(yōu)先環(huán)境中的代理性能和平均延遲上,這涉及到大量使用云端點。雖然這為系統(tǒng)性能提供了一定的基準,但它限制了在不依賴云基礎設施的環(huán)境中的應用廣泛性。此外,目前的實現(xiàn)主要關注地理空間數(shù)據(jù),這可能限制了其在其他類型的數(shù)據(jù)密集型任務中的應用。

2. 未來工作

為了克服這些限制并進一步提升系統(tǒng)級優(yōu)化的能力,未來的工作將探索將GPT驅動的緩存操作擴展到其他計算環(huán)境,如本地執(zhí)行設備,這可能包括使用能夠在本地運行的GPT替代品,如Llama-3和Phi-3.5。此外,計劃將評估擴展到更廣泛的任務范圍,包括那些在最近的系統(tǒng)級LLM優(yōu)化論文中考慮的正交任務。

通過這些努力,希望能夠進一步利用LLM進行系統(tǒng)級優(yōu)化,以提高復雜數(shù)據(jù)密集型環(huán)境中的系統(tǒng)效率。

總結:LLM-dCache的貢獻與系統(tǒng)級優(yōu)化的潛力

在大型語言模型(LLM)的發(fā)展中,LLM-dCache的引入標志著一個重要的進步,它通過緩存機制優(yōu)化了數(shù)據(jù)訪問模式,顯著提升了系統(tǒng)效率。本章節(jié)將總結LLM-dCache的主要貢獻,并探討其在系統(tǒng)級優(yōu)化中的潛力。

1. LLM-dCache的核心貢獻

LLM-dCache通過將緩存操作作為可調用的API工具集成到LLM中,使得大型語言模型能夠自主管理緩存操作。這種設計不僅減少了對傳統(tǒng)程序邏輯的依賴,還提高了緩存管理的靈活性和效率。例如,在處理地理空間數(shù)據(jù)時,LLM-dCache能夠根據(jù)數(shù)據(jù)的重用模式動態(tài)調整緩存內容,從而減少了數(shù)據(jù)加載時間并提高了任務完成速度。

2. 系統(tǒng)級優(yōu)化的實現(xiàn)

通過將緩存操作嵌入到LLM的決策過程中,LLM-dCache有效地將系統(tǒng)優(yōu)化的決策權下放給了語言模型本身。這一策略不僅簡化了系統(tǒng)設計,還提高了操作的靈活性。在實際應用中,這意味著LLM可以根據(jù)當前的任務需求和數(shù)據(jù)狀態(tài),自主決定何時讀取或更新緩存,從而優(yōu)化整體的系統(tǒng)性能。

3. 提升任務處理速度和準確性

在多個測試場景中,LLM-dCache顯示出了顯著的性能提升。例如,在地理空間平臺上的評估顯示,通過使用LLM-dCache,任務完成時間平均縮短了1.24倍。此外,緩存策略的優(yōu)化還確保了在不同的模型和提示技術中,輸出的質量和功能性不受影響。

4. 對未來系統(tǒng)級優(yōu)化的啟示

LLM-dCache的成功實施為未來的系統(tǒng)級優(yōu)化提供了新的思路。通過進一步探索和擴展這種以LLM為中心的優(yōu)化策略,我們可以將其應用于更廣泛的任務和環(huán)境中,如動態(tài)電壓頻率調整(DVFS)、核心分配和熱管理等。此外,這種策略的推廣還可能促進其他非GPT工具增強型代理在不同計算環(huán)境中的無縫集成。

總之,LLM-dCache不僅提升了大型語言模型在處理復雜數(shù)據(jù)任務時的效率和靈活性,還展示了利用LLM進行系統(tǒng)級優(yōu)化的巨大潛力。隨著技術的進一步發(fā)展,我們期待看到更多基于LLM的系統(tǒng)優(yōu)化解決方案的出現(xiàn)。

本文轉載自 ??AI論文解讀??,作者:柏企

已于2024-10-9 09:39:06修改
收藏
回復
舉報
回復
相關推薦
久久精品国产v日韩v亚洲| 2014亚洲片线观看视频免费| 国产在线精品一区二区不卡了| 正在播放亚洲一区| 日韩精品视频在线观看网址| 久久视频在线看| 91高清视频免费| 白白色视频在线| 欧美bbbbb| 在线免费观看视频黄| 日韩伦理电影网站| 一区二区三区久久| 欧美另类videosbestsex日本| 全球成人免费直播| 久久青青视频| 中文字幕在线亚洲| 在线影视一区| 亚洲特级毛片| 蜜月aⅴ免费一区二区三区| 亚久久调教视频| 97精品在线视频| 黄色精品视频| 五月天欧美精品| 亚洲欧美日韩一级| 激情综合一区二区三区| 天堂在线中文网官网| 午夜精品久久久久久久久久| 亚洲精品高清无码视频| 青青草原综合久久大伊人精品优势| 国产成人精品久久亚洲高清不卡| 欧美天堂一区| 精品免费日韩av| 四虎影视成人| 欧美中文字幕久久| 一级视频在线观看| 一区在线观看免费| 91传媒久久久| 91蝌蚪国产九色| 免费在线黄网站| 成人少妇影院yyyy| 一本二本三本亚洲码| 午夜一级久久| 国内一区二区三区在线视频| 在线观看黄av| 色综合久久综合| 国产三级在线看| 午夜精品久久久久久久| 樱花在线免费观看| 亚洲免费资源在线播放| 免费xxxxx网站中文字幕| 国产精品麻豆网站| 欧美福利网站| 一区二区三区欧美视频| 亚洲mv在线观看| 久草在线青青草| 亚洲国产精品影院| 国产乱子伦农村叉叉叉| 欧美做爰性生交视频| 欧美极品videos大乳护士| 欧美三级三级三级爽爽爽| 成人永久免费网站| 国产精品激情偷乱一区二区∴| 热99这里只有精品| 国产激情一区二区三区四区| 久久久性生活视频| 成人丝袜视频网| 国产av人人夜夜澡人人爽麻豆| 国产在线播放一区三区四| av电影一区二区三区| 国产成人在线色| 亚洲 欧美 日韩 国产综合 在线| 97久久精品人人做人人爽| 国产精品99久久免费黑人人妻| 波多野结衣在线一区| 日本wwwwww| 99久久综合99久久综合网站| 亚欧无线一线二线三线区别| 国产精品日产欧美久久久久| 浪潮av在线| 欧美日韩一区高清| xxxx视频在线| 久久色在线播放| 米奇777超碰欧美日韩亚洲| 国产综合久久久久| 久久综合图片| 免费在线观看视频a| 中文欧美字幕免费| 一二三区在线视频| 在线91免费看| av亚洲一区| 日韩免费视频在线观看| 日韩极品少妇| 亚洲小视频在线播放| 色悠悠久久综合| av男人的天堂在线| 中文字幕精品久久| 久久密一区二区三区| 国产一区二区丝袜| 丁香一区二区三区| 国产乱妇乱子在线播视频播放网站| 国产日韩欧美一区二区三区四区| 天天插综合网| 国内自拍亚洲| 国产精品黄色av| 欧美激情777| 五月天亚洲综合情| 日韩美女中文字幕| 日韩一区二区在线观看| 午夜久久影院| 久中文字幕一区| 国产高清在线观看免费不卡| 国产真实生活伦对白| 欧美日韩美少妇| 999久久久国产999久久久| 成人写真视频福利网| 国产一区二区三区黄视频 | 国产社区精品视频| 欧美激情精品久久久久久久变态| 亚洲精品97| 你真棒插曲来救救我在线观看| 亚洲成人久久影院| 巨胸喷奶水www久久久| 国产精品一久久香蕉国产线看观看| 免费日韩av片| 成年人黄色片视频| 91麻豆精品91久久久久同性| 亚洲视频一起| 久久五月天婷婷| 国产日韩欧美精品综合| 麻豆av免费在线观看| 国内揄拍国内精品少妇国语| 日韩国产精品大片| 2222www色视频在线观看| 国产亚洲人成a一在线v站| 成人免费看片网站| 一区二区视频免费在线观看| 日韩电影在线观看一区| 欧美尤物美女在线| 日本一区高清不卡| 欧美成人精品1314www| 精品亚洲免费视频| 亚洲色图图片| 特级全黄一级毛片| 欧美高清在线播放| 亚洲高清影视| 精品一区二区三区av| 992kp快乐看片永久免费网址| 337p亚洲精品色噜噜噜| 神马久久一区二区三区| 久久这里只有精品18| 欧美一区二区在线看| 久久高清精品| 日韩视频在线免费看| 亚洲视频免费一区| 日韩黄色免费电影| 成人在线播放视频| 国产精品视频xxx| 久久色在线视频| 亚洲成人你懂的| 91av在线不卡| 精品欧美久久久| 成年人视频在线观看免费| 绯色av一区二区| av免费播放网址| 黄色在线视频网站| 波多野结衣在线网站| 99不卡视频| 色婷婷在线播放| 中文在线а√在线8| 污网站在线免费看| 一本一道dvd在线观看免费视频| 在线观看黄av| 污污的网站在线看| 亚洲电影一级片| 狠狠色丁香久久婷婷综合_中| 成人国产精品免费网站| 亚洲色图欧美激情| 亚洲香肠在线观看| 日韩欧美精品中文字幕| 日韩电影免费观看中文字幕| 日韩高清免费观看| 91国产免费看| 中文欧美字幕免费| 日本美女一区二区三区视频| 久久久久久久欧美精品| 精品动漫一区二区三区| 成人国产精品一区二区| 国产精品手机在线| 欧美久久在线观看| 你懂得影院夜精品a| 激情综合电影网| 伊色综合久久之综合久久| 国产日韩一区二区三区在线| 亚洲自拍偷拍综合| 日韩欧美中文字幕一区| 久久艳妇乳肉豪妇荡乳av| 特黄特色大片免费视频大全| 亚洲精品二区三区| 国产精品视频第一区| 亚洲高清一区二|