国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Andrej Karpathy:大模型有內(nèi)存限制,這個(gè)妙招挺好用

開發(fā)
Andrej Karpathy 用通俗易懂的語(yǔ)言介紹了 speculative execution。

「如今,LLM(大語(yǔ)言模型)并不是單點(diǎn)突破的 —— 而是需要多個(gè)重要組件有效協(xié)同工作的系統(tǒng)。Speculative decoding 是幫助我們從系統(tǒng)角度思考的一個(gè)很好的例子。」愛丁堡大學(xué)博士生符堯表示道。

符堯上述觀點(diǎn)評(píng)論的是特斯拉前 AI 總監(jiān)、年初重回 OpenAI 的 Andrej Karpathy 剛剛發(fā)布的一條推特。

人形機(jī)器人公司 1X Technologies 的 AI 副總裁 Eric Jang 評(píng)價(jià)道:「Karpathy 很好的解釋了 LLM 的 speculative execution。其他自回歸模型可能會(huì)以類似的方式加速。連續(xù)(擴(kuò)散)模型可能從 K 步中獲益較少(可能在第 1 步后偏離猜測(cè)),但可以將其應(yīng)用于 VQ-latents 的離散代碼。」

看完上述評(píng)價(jià),我們大概也了解了,Karpathy 說(shuō)的「Speculative execution」,這是優(yōu)化技術(shù)的一類,采用這個(gè)技術(shù)的計(jì)算機(jī)系統(tǒng)會(huì)根據(jù)現(xiàn)有信息,利用空轉(zhuǎn)時(shí)間提前執(zhí)行一些將來(lái)可能用得上,也可能用不上的指令。如果指令執(zhí)行完成后發(fā)現(xiàn)用不上,系統(tǒng)會(huì)拋棄計(jì)算結(jié)果,并回退執(zhí)行期間造成的副作用(如緩存)。

為了讓大家更好的理解 Karpathy 的內(nèi)容。我們先介紹一下「Speculative decoding」方法,對(duì)后續(xù)理解更加有益,其主要用于加速大模型的推理。據(jù)了解,GPT-4 泄密報(bào)告也提到了 OpenAI 線上模型推理使用了它(不確定是否 100%)。

關(guān)于「Speculative decoding」,已有幾篇重要文獻(xiàn)可供參考,這也是 Karpathy 為了寫這則推特所參考的論文,包括谷歌今年 1 月發(fā)表的論文《Fast Inference from Transformers via Speculative Decoding》、DeepMind 今年 2 月發(fā)表的論文《Accelerating Large Language Model Decoding with Speculative Sampling》,以及谷歌等機(jī)構(gòu) 2018 年的論文《Blockwise Parallel Decoding for Deep Autoregressive Models 》 。

簡(jiǎn)單來(lái)說(shuō),「Speculative decoding」使用兩個(gè)模型:一個(gè)是原始目標(biāo)模型稱為大模型,另一個(gè)是比原始模型小得多的近似模型稱為小模型。主要思想是先讓小模型提前解碼多個(gè) token 進(jìn)行猜測(cè),并將它們作為單個(gè) batch 輸入到一個(gè)大模型中進(jìn)行審核修正,其效果和直接用大模型解碼等價(jià)。如果小模型猜測(cè)的不準(zhǔn)確,那么大型模型會(huì)放棄小模型預(yù)測(cè)的 token,繼續(xù)使用大型模型進(jìn)行解碼。

由于小模型計(jì)算量小,從而大大減少了內(nèi)存訪問需求。

介紹完「Speculative decoding」,我們?cè)倩氐?Karpathy 的推特。Karpathy 是針對(duì)下面內(nèi)容回復(fù)的。

Karpathy 表示:對(duì)于 LLM 來(lái)說(shuō),「Speculative execution」 是一種極好的推理 — 時(shí)間優(yōu)化方法。

它取決于以下方面:在單個(gè)輸入 token 上分發(fā) LLM 所花費(fèi)的時(shí)間與在批處理中分發(fā) K 個(gè)輸入 token 所花費(fèi)的時(shí)間一樣多。產(chǎn)生這樣的原因是因?yàn)椴蓸訃?yán)重受內(nèi)存限制:模型運(yùn)行時(shí)的大部分工作不是在做計(jì)算,而是從 VRAM 讀取 transformer 的權(quán)重到片上緩存進(jìn)行處理。如果你要做的工作是來(lái)讀取這些權(quán)值,你可以把它們應(yīng)用到一整批輸入向量上。

但是我們不能一次性采樣一批 K 個(gè) token,因?yàn)槊?N 個(gè) token 都取決于我們?cè)诘?N-1 步采樣的 token。由于存在串行依賴性,因此基線實(shí)現(xiàn)只是從左到右逐一進(jìn)行。

現(xiàn)在最聰明的想法是使用一個(gè)小而便宜的草稿模型(draft model),先生成 K 個(gè) token 候選序列,即一個(gè)「草稿」。然后用大模型批量的將輸入組合在一起。速度幾乎與僅輸入一個(gè) token 一樣快。接著從左到右遍歷模型和樣本 token 預(yù)測(cè)的 logits。任何與「草稿」一致的樣本都允許立即跳到下一個(gè) token。如果存在分歧,那么就丟棄「草稿」并承擔(dān)一些一次性工作的成本(對(duì)「草稿」進(jìn)行采樣并為所有后續(xù) token 進(jìn)行前向傳遞)。

這種方法起作用的原因在于,很多「草稿」token 都會(huì)被接受,因?yàn)樗鼈兒苋菀祝约词故歉〉牟莞迥P鸵材艿玫剿鼈儭.?dāng)這些簡(jiǎn)單的 token 被接受時(shí),我們會(huì)跳過(guò)這些部分。大模型不同意的 hard token 會(huì)回落到原始速度,但由于一些額外的工作,實(shí)際上速度會(huì)慢一些。 

Karpathy 表示,這個(gè)奇怪的技巧之所以有效,是因?yàn)?LLM 在推理時(shí)受到內(nèi)存限制,在對(duì)單個(gè)序列進(jìn)行采樣的 batch size=1 設(shè)置中,很大一部分本地 LLM 用例都屬于這種情況。因?yàn)榇蠖鄶?shù) token 都很「簡(jiǎn)單」。

參考鏈接:https://twitter.com/karpathy/status/1697318534555336961

責(zé)任編輯:趙寧寧 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-08-27 09:32:04

2021-08-02 07:50:42

腳本Shell日志

2022-08-21 21:15:28

模型AI

2025-02-10 07:00:00

JavaScript數(shù)組方法前端

2015-03-11 10:30:52

Apple Pay

2024-12-02 09:20:00

2023-05-16 14:07:52

AI自然語(yǔ)言

2024-09-29 13:30:00

2024-12-26 16:36:22

2010-06-09 14:55:11

TCP IP協(xié)議限制

2021-03-21 23:08:46

安卓手機(jī)工具

2024-12-04 09:25:00

2023-01-06 12:49:53

訓(xùn)練庫(kù)

2023-05-29 09:48:36

AI李飛飛

2025-06-05 09:03:39

2024-08-16 16:13:00

2010-09-29 14:00:05

2010-07-21 11:50:24

telnet亂碼

2010-09-25 15:40:52

配置JVM內(nèi)存

2025-07-14 09:26:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产色视频一区| 奇米影视亚洲狠狠色| 91午夜国产| 久久在线91| 91精品视频一区| 大陆精大陆国产国语精品| 亚洲欧美日韩国产成人| 91福利国产在线观看菠萝蜜| 欧美视频在线免费看| 羞羞视频网站在线免费观看| 国产精品久久久久久久蜜臀| 三级a在线观看| 久久久精品蜜桃| 日韩av一二三四区| 北条麻妃一区二区三区| 久久免费一级片| 激情五月婷婷综合网| 色阁综合av| 男女视频一区二区| 亚洲a∨一区二区三区| 久热精品视频| 在线播放豆国产99亚洲| 久久草av在线| 中文字幕中文字幕在线中心一区| 美女精品一区| 亚洲欧洲在线一区| 国产精品白丝jk黑袜喷水| 桥本有菜av在线| 国产999精品久久久久久| www.日本三级| 久久综合五月天婷婷伊人| 奇米影音第四色| 亚洲国产精品ⅴa在线观看| 国产网站观看9久| 天天亚洲美女在线视频| 日本在线免费看| 日韩av在线高清| 久久久久黄色| 欧美一级在线播放| 999视频精品| 国产亚洲欧美一区二区| 午夜在线精品| 男人添女荫道口喷水视频| 国产三级精品在线| 亚洲人av在线| 亚洲第一偷拍网| 国产精品亚洲欧美日韩一区在线| 国产va免费精品高清在线观看| 女同性一区二区三区人了人一| 日韩欧美一区二区视频在线播放| 国产麻豆精品视频| 成年人在线观看视频免费| 午夜视频在线观看一区二区| 国产日产一区二区三区| 色偷偷9999www| 欧美男gay| 欧美视频1区| 91免费在线看| 在线天堂av| 欧美一级电影网站| 欧美日韩在线精品一区二区三区激情综合 | 女同久久另类99精品国产| 国产精品久久久久久久久粉嫩av| 国精品一区二区三区| 一级一片免费播放| 中文字幕高清不卡| 国产乱子伦三级在线播放| 亚洲色图欧美制服丝袜另类第一页| 国内精品国产成人国产三级粉色| 国产精品亚洲综合| 国产乱码精品一区二区三区忘忧草 | 成全电影大全在线观看| 欧美理论电影在线播放| 国产精品久久久久久| 中文字幕精品一区日韩| 国产精品传媒入口麻豆| 日韩伦理av| 97精品国产97久久久久久免费 | 久久精品久久99精品久久| 在线观看av网页| 精品三级在线观看| 欧美91在线| 在线电影看在线一区二区三区| 亚洲精品成人悠悠色影视| 中日韩脚交footjobhd| 91精品国产自产在线| 美女视频免费一区| 污黄视频在线看| 在线一区二区日韩| 中文日韩欧美| 一级毛片免费视频| 久久精品视频网站| 免费在线成人网| 天堂电影在线| 久久亚洲精品一区| 日本网站在线观看一区二区三区| 日日噜噜噜夜夜爽爽狠狠视频 | 羞羞视频在线观看不卡| 日本亚洲欧美成人| 成人国产一区二区三区精品| 蜜芽在线免费观看| 国产在线视频不卡| 中文字幕不卡的av| 成人涩涩视频| 日韩精品久久久| 欧美日韩精品国产| 日韩有码一区| 久久久999视频| 精品国产91九色蝌蚪| 欧美 日韩 国产 一区| 交视频在线观看国产| 久久精品国产69国产精品亚洲| av成人黄色| 午夜影院在线免费观看| 18性欧美xxxⅹ性满足| 国产成人av电影免费在线观看| 久久久久久国产精品免费无遮挡| 国产精品久久久久77777| 国产精品久久久久久久午夜片| 欧美成人黄色| 又大又硬又爽免费视频| 精品国产亚洲一区二区三区在线观看| 欧美日韩国产高清| 污视频在线看操| 91精品国产综合久久香蕉的用户体验| 国产精品久久久久婷婷二区次| 精品一区二区三区中文字幕在线 | 国内自拍一区| 中出在线观看| 国产不卡精品视男人的天堂| 国产精品毛片久久久久久久| 999精品视频在线观看| 精品少妇人妻av免费久久洗澡| 亚洲人在线观看| 狠狠色综合日日| 日韩大尺度黄色| 黄色片网址在线观看| 久久这里有精品视频| 久久先锋影音av鲁色资源网| 97久久中文字幕| 日日噜噜夜夜狠狠| 国产91精品高潮白浆喷水| 亚洲美女视频在线| 欧美综合久久| 色综合成人av| 国产成人免费观看| 欧美精品乱码久久久久久按摩 | 免费在线国产视频| 午夜探花在线观看| 国产亚洲一区二区在线| 久久亚洲捆绑美女| 亚洲另类av| 中文字幕在线二区| 国产伦精品一区二区三区四区免费 | 日韩精品一区二区三区中文 | 国内成人精品一区| 亚洲免费av高清| 97视频精品| av在线播放网| 一区二区在线观看网站| 在线观看日韩视频| **网站欧美大片在线观看| 色777狠狠狠综合伊人| 91成人高清| 91精品国产毛片武则天| 久久亚洲综合国产精品99麻豆精品福利 | 在线看的av网站| 在线看成人av电影| 久久久精品视频成人| 亚洲日本护士毛茸茸| 欧美粗暴jizz性欧美20| 91福利国产在线观看菠萝蜜| 久久久久久久久久网| 国产精品99久久久久久久久久久久| 色综合一个色综合| 国产一区二区免费看| 国产精一区二区| 裸体网站视频| 欧美日韩精品一区| 久久天天躁狠狠躁夜夜av| 天天操天天色综合| 国产一区 二区 三区一级| 久久精品亚洲成在人线av网址| 高清福利在线观看| 国产夫妻自拍一区| 国产日韩在线视频| 亚洲色图第三页| 亚洲丰满少妇videoshd| 久久99国内精品| 九九综合九九| 国产精品69xx| 全部孕妇毛片丰满孕妇孕交| 亚洲啪啪av| 国产精品视频成人| 亚洲偷欧美偷国内偷| 天天影视涩香欲综合网| 成人免费毛片app| 欧美特黄一区| 国产精品巨作av| 中文在线8资源库|