国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

推理成本驟降75%!gpt-oss用新數(shù)據(jù)類型實(shí)現(xiàn)4倍推理速度,80GB顯卡能跑1200億參數(shù)大模型

人工智能 新聞
MXFP4在把內(nèi)存占用降為同規(guī)模BF16模型的四分之一的同時(shí),還把生成token的速度提升了整整4倍。

OpenAI在最新的開源模型gpt-oss上采用的MXFP4數(shù)據(jù)類型,直接讓推理成本暴降75%!

更驚人的是,MXFP4在把內(nèi)存占用降為同規(guī)模BF16模型的四分之一的同時(shí),還把生成token的速度提升了整整4倍。

換句話說,這一操作直接把1200億參數(shù)的大模型塞進(jìn)80GB顯存的顯卡,哪怕是只有16GB顯存的顯卡也能跑200億參數(shù)的版本。

圖片

(注:顯存容量通常會(huì)大于Checkpoint Size)

相比以往的數(shù)據(jù)類型,MXFP4提供了極高的性價(jià)比,模型運(yùn)行所需的硬件資源僅為之前的四分之一。

MXFP4有什么魔力?

在gpt-oss中,OpenAI將MXFP4量化應(yīng)用于大約90%的權(quán)重,這一操作的直接動(dòng)機(jī)(收益)就是讓模型運(yùn)行成本變得更加便宜。

將gpt-oss模型量化為MXFP4 后,大語言模型的占用內(nèi)存僅為等規(guī)模BF16模型的1/4,而且生成token的速度最高可提升4倍。

圖片

如何通過改變數(shù)據(jù)類型降低模型運(yùn)行成本?這里的邏輯是這樣的:

模型的運(yùn)行成本主要由權(quán)重存儲(chǔ)內(nèi)存帶寬兩個(gè)部分組成。

前者是模型參數(shù)存放和占用的空間,也就是存儲(chǔ)它們所需要的字節(jié)數(shù)。

后者則是模型在推理時(shí),數(shù)據(jù)讀寫速度和容量的限制。

數(shù)據(jù)類型的變化將直接影響權(quán)重存儲(chǔ)和內(nèi)存帶寬的占用。

例如,傳統(tǒng)模型權(quán)重通常用FP32(32位浮點(diǎn)數(shù))存儲(chǔ),每個(gè)參數(shù)占用4字節(jié)內(nèi)存。

如果用MXFP4,那么每個(gè)權(quán)重只有半字節(jié)權(quán)重存儲(chǔ)大小是FP32的1/8,這就極大地壓縮了權(quán)重?cái)?shù)據(jù)量的大小。

這一壓縮不僅降低了模型的存儲(chǔ)空間,還能讓模型在同樣的帶寬下完成更快地?cái)?shù)據(jù)讀取和寫入,從而提高推理速度。

由此,通過改變數(shù)據(jù)類型就能實(shí)現(xiàn)推理成本的降本增效。

那么,MXFP4是怎么實(shí)現(xiàn)這一點(diǎn)的?

MXFP4

MXFP4的全稱是微縮放4位浮點(diǎn)數(shù)(Micro-scaling Floating Point 4-bit),是由Open Compute Project (OCP) 定義的4位浮點(diǎn)數(shù)據(jù)類型。

(注:OCP是Facebook于2011年發(fā)起的超大規(guī)模數(shù)據(jù)中心合作組織,旨在降低數(shù)據(jù)中心組件成本并提高可獲取性。)

在深度學(xué)習(xí)領(lǐng)域中,數(shù)據(jù)類型的精度和效率一直是研究者取舍的重點(diǎn)。

例如,傳統(tǒng)的FP4只有四位,1位符號(hào)位(表示正負(fù)),2位指數(shù)位(決定數(shù)值的量級(jí)),1位尾數(shù)位(表示小數(shù)部分)。

這種表示方法雖然壓縮了數(shù)據(jù)量,但也導(dǎo)致了非常有限的可表示的數(shù)值范圍,它只能表示8個(gè)正數(shù)和8個(gè)負(fù)數(shù)。

相較之下,BF16(1位符號(hào)位,8位指數(shù)位和7 位尾數(shù)位)則能表示 65,536個(gè)數(shù)值,不過表示范圍的增加也帶來了計(jì)算成本的上升。

如果為了提高計(jì)算效率,直接把這4個(gè)BF16數(shù)值:0.0625、0.375、0.078125、0.25直接轉(zhuǎn)換成FP4,那么它們會(huì)變成 0、0.5、0、0.5。

不難看出,這樣的誤差顯然是無法接受的。

于是,為了在減少數(shù)據(jù)量的同時(shí)確保一定的精度,MXFP4通過將一組高精度數(shù)值(默認(rèn)32個(gè))乘以一個(gè)公共縮放因子(這個(gè)縮放因子是一個(gè)8位二進(jìn)制指數(shù))。這樣,我們前面那4個(gè)BF16數(shù)值就會(huì)變成 1、6、1.5、4。

圖片

這樣就既實(shí)現(xiàn)了極致的數(shù)據(jù)大小,又維持了數(shù)值間大小關(guān)系的精度。

此外,這一過程的實(shí)現(xiàn)還與計(jì)算硬件相關(guān)

一般規(guī)律是,每將浮點(diǎn)精度減半,芯片的浮點(diǎn)吞吐量就能翻倍。

比如,一個(gè)B200SXM模塊的稠密BF16運(yùn)算性能約為2.2 petaFLOPS,降到FP4(Nvidia Blackwell 芯片提供硬件加速)后,就能提升到9petaFLOPS

雖然這會(huì)在吞吐量上帶來一些提升,但在推理階段,更多FLOPS的意義主要是減少模型開始生成答案的等待時(shí)間

值得注意的是,運(yùn)行MXFP4模型并不要求硬件必須原生支持FP4

用于訓(xùn)練gpt-oss的Nvidia H100就不支持原生FP4,不過它依然可以運(yùn)行,只是無法享受該數(shù)據(jù)類型的全部?jī)?yōu)勢(shì)。

低精度與計(jì)算量的取舍

事實(shí)上,MXFP4并不是新概念。早在2023年的報(bào)告中,OCP就在報(bào)告《OCP Microscaling Formats (MX) Specification Version 1.0》中詳細(xì)介紹過這一數(shù)據(jù)類型。

圖片

然而,這種低精度的數(shù)據(jù)類型通常被認(rèn)為是對(duì)性價(jià)比的妥協(xié),因?yàn)榫认陆禃?huì)導(dǎo)致質(zhì)量損失。損失的程度取決于具體的量化方法。

不過,已經(jīng)有足夠多的研究表明,將數(shù)據(jù)精度從16位降到8位,在大語言模型場(chǎng)景下幾乎沒有質(zhì)量損失,這種精度已經(jīng)足夠支撐模型的正常工作。

事實(shí)上,一些模型開發(fā)者,例如DeepSeek已經(jīng)開始直接用FP8進(jìn)行訓(xùn)練。

此外,雖然MXFP4比標(biāo)準(zhǔn)FP4好得多,但它也有缺陷

例如,英偉達(dá)就認(rèn)為這種數(shù)據(jù)類型相比FP8仍可能出現(xiàn)質(zhì)量下降,部分原因是其縮放塊大小(Scaling Block Size)為32,不夠細(xì)粒化。

為此,英偉達(dá)推出了自己的微縮放數(shù)據(jù)類型NVFP4,通過將縮放塊大小降至16和使用FP8縮放因子來提高質(zhì)量。

這幾乎等同于FP8的工作方式。只不過MXFP4是在張量?jī)?nèi)部的小塊上應(yīng)用縮放因子,而不是作用于整個(gè)張量,從而在數(shù)值之間實(shí)現(xiàn)更細(xì)的粒度。

最后,在gpt-oss上,OpenAI只使用了MXFP4。

鑒于OpenAI在AI領(lǐng)域上的影響力,這基本上就等于在說:

如果MXFP4對(duì)我們夠用,那對(duì)你也應(yīng)該夠用。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-08-07 14:05:40

OpenAI大模型開源

2023-05-15 15:38:59

AI模型

2025-08-08 04:11:00

GPT-OSS大模型算法

2025-03-14 11:56:52

2024-07-08 13:04:01

2024-07-19 09:26:12

2024-02-01 12:43:16

模型數(shù)據(jù)

2024-07-19 09:59:31

2025-06-11 14:39:50

AILLMMistral

2025-02-19 15:17:24

2025-02-12 09:20:12

2023-01-18 09:51:56

模型開源

2024-01-24 13:11:00

AI模型

2025-08-18 09:15:00

2025-10-06 01:00:00

DeepSeekV3.2-Exp

2024-01-26 13:18:00

AI訓(xùn)練

2025-04-16 09:46:46

2025-01-08 13:15:02

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美在线综合视频| 成人av网址在线| 老司机一区二区| 久久久噜久噜久久综合| 福利成人在线观看| 久久婷婷一区二区三区| 91精品视频一区| 久久九九精品视频| 国产精品自产拍在线观| 神马精品久久| 一区视频在线看| 欧美日韩亚洲另类| 免费观看中文字幕| 伊人久久大香线蕉av超碰| 成人欧美一区二区三区小说| 成人高清视频观看www| 中文字幕一区二区三三| 欧美成人精品在线| 草草在线观看| 在线区一区二视频| 五月伊人六月| 中文久久乱码一区二区| 久久精品视频在线看| 日韩欧美一区在线观看| 伊大人久久香线焦宗合一75大| 91色porny蝌蚪| 九一免费在线观看| 石原莉奈一区二区三区在线观看| 91免费精品视频| 精品国产精品| 77777亚洲午夜久久多人| 99蜜月精品久久91| 欧美精品一区二区高清在线观看| 日本在线观看www| 欧美优质美女网站| 国产高清一级毛片在线不卡| 色婷婷久久久综合中文字幕| 成人a视频在线| 一区二区三区小说| 黑人巨大精品欧美一区二区奶水| 国产精品传媒在线| 97秋霞电影网| 亚洲欧美一区二区视频| www.av99| 一区二区在线电影| 在线影视一区| 亚洲成人精品影院| 尤物视频网站在线观看| 精品久久久久久| 欧美女同网站| 欧美日韩视频在线一区二区| 97超碰国产一区二区三区| 欧美日韩一级片网站| 超碰电影在线播放| 亚洲成av人乱码色午夜| 男人久久天堂| 中文字幕在线观看亚洲| a∨色狠狠一区二区三区| 精品国产自在精品国产浪潮| 成人福利一区| 3d成人动漫网站| www国产在线观看| 亚洲国产福利| 亚洲精品中文字| 成人免费直播| 91精品蜜臀一区二区三区在线| 中文字幕在线不卡一区| bt电影在线| 欧美日韩一区二区在线 | 黑人巨大精品欧美一区二区桃花岛| 精品噜噜噜噜久久久久久久久试看 | 免费男女羞羞的视频网站中文字幕| 中文字幕精品一区二区三区精品| 宅男深夜免费观看视频| 欧美一区二区国产| 欧美电影h版| 欧美在线免费看| 在线视频日韩| 69堂免费视频| 一个色在线综合| 色呦呦在线视频| 欧美日韩高清在线观看| 亚洲综合激情在线| 久久综合亚洲精品| 亚洲色图制服诱惑| 日本成a人片在线观看| 中文字幕国产日韩| 成人6969www免费视频| 亚洲 国产 日韩 综合一区| 91丝袜国产在线播放| 青青草娱乐在线| 亚洲欧美在线磁力| 欧美一区2区| 最新av在线免费观看| 亚洲色图都市小说| 福利视频在线| 6080yy精品一区二区三区| 亚洲精选久久| 男人搞女人网站| 日韩视频在线一区二区| 草草视频在线一区二区| 好吊色欧美一区二区三区视频| 成人免费av在线| 国产在线视频网| 伊人久久大香线蕉综合影院首页| 久久99国产精品久久久久久久久| 亚洲视频精品| 成人性生生活性生交12| 欧美xingq一区二区| 美女亚洲一区| 男同互操gay射视频在线看| 一区二区三区四区激情| 日本午夜大片a在线观看| 国产有码一区二区| 不卡视频一二三四| 香港伦理在线| 国产99久久久欧美黑人| 国产丶欧美丶日本不卡视频| 深夜福利免费在线观看| 久久精品视频中文字幕| 久久狠狠一本精品综合网| 高清免费观看在线| 久久久999国产| 免费成人在线观看| 天堂在线中文字幕| 91精品国产色综合| 国产东北露脸精品视频| 成人免费在线| 99精品99久久久久久宅男| 中文字幕在线一区| 日本美女久久| 永久免费精品视频网站| 欧美精品日韩一区| 欧美岛国激情| 欧美艹逼视频| 欧美亚洲视频在线看网址| 久久亚洲精品小早川怜子| 一根才成人网| 亚洲视频导航| 精品国产免费一区二区三区香蕉| 欧美阿v一级看视频| 黄动漫在线免费观看| 国模gogo一区二区大胆私拍| 成人精品国产福利| 韩国成人动漫| 亚洲一区二区自拍偷拍| 欧美一区二区三区免费视频| 在线看片一区| av电影在线观看网址| 亚洲最大激情中文字幕| 亚洲一级二级三级| 激情五月综合网| 午夜影院在线| 国产精品视频自在线| 亚洲一二三区视频在线观看| 亚洲专区视频| 又黄又www| 国产女同一区二区| 四虎成人精品一区二区免费网站| 亚洲国产精品va在看黑人| 亚洲综合精品| 理论片午午伦夜理片在线播放| 国产伦精品一区二区三区视频孕妇 | 欧美网站一区二区| 国产在线成人| 黑人与亚洲人色ⅹvideos| 亚洲精品免费一区二区三区| 午夜电影一区二区三区| 欧美+日本+国产+在线a∨观看| 激情小说 在线视频| 国产区欧美区日韩区| 欧美视频在线一区| 三级影片在线观看欧美日韩一区二区| 欧美bbbxxxxx| 精品无码一区二区三区爱欲| 欧美另类99xxxxx| 一区二区三区在线看| 久久社区一区| 免费高清在线观看| 大桥未久一区二区| 蜜臀久久99精品久久久久久宅男 | 激情综合色丁香一区二区| 看黄在线观看| 精品久久一二三| 欧美亚洲另类制服自拍| 欧美日韩亚洲一区二区| 国产一区二区三区的电影 | 亚洲同性同志一二三专区| 在线日韩网站| 免费a级毛片在线观看| 久久精品999| 伊人久久亚洲热| 久久综合九色欧美综合狠狠| 国产成人在线视频网址| 久久91精品久久久久久秒播| 国产激情91久久精品导航 | 国产精品亚洲二区| 中文字幕高清在线| 国产亚洲精品成人av久久ww| 国产亚洲精久久久久久|