国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

如何使用GPTQ量化使LLM更輕

譯文
人工智能
為了緩解成本高昂和運(yùn)行困難等問(wèn)題,研究人員開(kāi)發(fā)了幾種LLM壓縮技術(shù),其中包括“量化”。量化通過(guò)改變參數(shù)的存儲(chǔ)方式來(lái)減少模型的誤差。

譯者 | 李睿

審校 | 重樓

大型語(yǔ)言模型(LLM)應(yīng)用的一大挑戰(zhàn)是其耗費(fèi)巨大的內(nèi)存和計(jì)算需求,通常需要數(shù)十GB的GPU內(nèi)存。這使得它們不僅昂貴而且難以運(yùn)行。

為了緩解這些問(wèn)題,研究人員開(kāi)發(fā)了幾種LLM壓縮技術(shù),其中包括“量化”。量化通過(guò)改變參數(shù)的存儲(chǔ)方式來(lái)減少模型的誤差。GPTQ就是這樣一種高效快速的算法。GPTQ通過(guò)AutoGPTQ庫(kù)得到了Hugging Face等流行框架的支持,并提供了一種經(jīng)濟(jì)有效的解決方案。以下是人們需要知道的關(guān)于用GPTQ量化LLM的事項(xiàng)。

什么是量化?

Transformer模型(例如LLM)通常使用16位浮點(diǎn)數(shù)字(fp16)存儲(chǔ)參數(shù)。因此,運(yùn)行一個(gè)有10億個(gè)參數(shù)的模型至少需要2GB的內(nèi)存,外加額外的開(kāi)銷(xiāo)資源。量化通過(guò)將這些參數(shù)轉(zhuǎn)換為更小的整數(shù)格式(例如int8或int4),有效地減小了模型的大小,從而為這個(gè)問(wèn)題提供了解決方案。量化算法面臨的挑戰(zhàn)是在最小化模型精度損失的同時(shí)減少模型的大小。

量化技術(shù)主要分為三大類(lèi):

  • 量化感知訓(xùn)練(QAT):這種技術(shù)將量化集成到訓(xùn)練過(guò)程中。通過(guò)允許模型從一開(kāi)始就學(xué)習(xí)低精度表示,QAT減少了通常與量化相關(guān)的精度損失。
  • 量化感知微調(diào)(QAFT):這種方法采用預(yù)訓(xùn)練的高精度模型,以較低的精度權(quán)重來(lái)保持其質(zhì)量。令人關(guān)注的QAFT技術(shù)包括QLoRA和參數(shù)有效和量化感知自適應(yīng)(PEQA),它們都是為了在減小模型大小的同時(shí)保持模型的訓(xùn)練質(zhì)量。
  • 訓(xùn)練后量化(PTQ):這種方法在模型訓(xùn)練完成之后,將LLM的參數(shù)轉(zhuǎn)換為精度較低的數(shù)據(jù)類(lèi)型。PTQ的目標(biāo)是在不改變其架構(gòu)或不需要重新訓(xùn)練的情況下降低模型的復(fù)雜性。

GPTQ

GPTQ是一種訓(xùn)練后量化技術(shù),使其成為非常大的模型的理想選擇,在這種模型中,完全訓(xùn)練甚至微調(diào)的成本可能高得令人望而卻步。它具有將模型量化為2位、3位或4位格式的能力,根據(jù)開(kāi)發(fā)人員的特定需求提供靈活性。

GPTQ采用了一套優(yōu)化技術(shù),在保持模型準(zhǔn)確性的同時(shí)簡(jiǎn)化了量化過(guò)程。根據(jù)研究機(jī)構(gòu)發(fā)表的一些論文,與之前提出的一次性量化方法相比,GPTQ的壓縮增益增加了一倍多,證明了其優(yōu)越的效率。

實(shí)驗(yàn)結(jié)果表明,當(dāng)使用像NVIDIA A100這樣的高端GPU時(shí),GPTQ可以將推理速度提高約3.25倍,當(dāng)使用更經(jīng)濟(jì)的選項(xiàng)(例如NVIDIA A6000)時(shí),GPTQ可以將推理速度提高4.5倍。

在實(shí)際比較中,具有1760億個(gè)參數(shù)的BLOOM模型可以使用GPTQ在不到4個(gè)GPU小時(shí)內(nèi)進(jìn)行量化。相比之下替代量化算法OBQ需要2個(gè)GPU小時(shí)來(lái)量化小得多的BERT模型,該模型只有3.36億個(gè)參數(shù)。

AutoGPTQ

GPTQ的創(chuàng)建者來(lái)自IST奧地利分布式算法和系統(tǒng)實(shí)驗(yàn)室,他們已經(jīng)在GitHub上公開(kāi)了代碼。這種實(shí)現(xiàn)支持LLM的OPT和BLOOM系列。

還有其他一些將GPTQ應(yīng)用于LLaMA模型的實(shí)現(xiàn),包括著名的Llama.cpp模型。然而,對(duì)于范圍更廣的Transformer模型,AutoGPTQ庫(kù)是一個(gè)可靠的選擇。它與廣泛使用的Hugging Face Transformers庫(kù)兼容,允許開(kāi)發(fā)人員將AutoGPTQ模型上傳到Hugging Face,使其可供應(yīng)用程序和其他開(kāi)發(fā)人員訪問(wèn)。

Hugging Face已經(jīng)擁有了幾個(gè)使用AutoGPTQ量化的模型,簡(jiǎn)化了它們的部署。Hugging Face AutoGPTQ集成還支持AMD GPU和參數(shù)高效微調(diào),包括低秩自適應(yīng)(LoRA)。

開(kāi)發(fā)人員可以使用Hugging Face的文本生成推理(TGI)工具包來(lái)運(yùn)行AutoGPTQ模型。根據(jù)Hugging Face的說(shuō)法,開(kāi)發(fā)人員可以使用AutoGPTQ在一個(gè)A100-80GB的GPU上托管700億個(gè)參數(shù)的模型,這在fp16格式的模型上是不可能的。

有關(guān)代碼示例和運(yùn)行AutoGPTQ的更多信息,可以參閱Hugging Face的Google Colab notebook

原文標(biāo)題:How to make your LLMs lighter with GPTQ quantization,作者:Ben Dickson

責(zé)任編輯:華軒 來(lái)源: 51CTO
相關(guān)推薦

2025-11-17 08:00:00

LLMAWQGPTQ

2023-11-17 14:37:56

2011-01-19 10:42:15

2009-12-23 15:41:26

2024-07-03 09:38:35

LLM人工智能

2009-05-20 14:43:38

ibmdwEasyMock測(cè)試

2023-10-30 10:54:01

2011-08-18 15:56:08

iPhone開(kāi)發(fā)內(nèi)存

2024-12-30 10:35:00

訓(xùn)練數(shù)據(jù)模型

2025-06-03 08:49:00

2024-09-11 15:59:31

LLM.int8()大模型量化

2009-05-25 17:48:16

IT服務(wù)管理

2024-03-01 09:00:00

大型語(yǔ)言模型數(shù)據(jù)集LLM

2025-06-03 08:40:00

LM StudioLLM人工智能

2024-12-31 00:00:10

LangServeLLM應(yīng)用部署

2023-11-17 22:55:09

量化模型

2024-04-17 10:08:20

LLM人工智能大型語(yǔ)言模型

2021-06-29 15:52:03

PythonPOST

2023-09-15 08:00:20

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

中文字幕欧美一| 欧美一级免费播放| 中文字幕一区二区三区四区五区六区 | 中文字幕av一区二区三区免费看| 久久99精品久久久久久青青91| caoporen国产精品| 91热门视频在线观看| 欧美影视一区二区三区| 色噜噜狠狠一区二区三区| 久久精品国产精品亚洲红杏| 色哟哟在线观看一区二区三区| 老司机午夜网站| 欧美肥老太太性生活| 精品国产电影一区二区| 蜜桃精品久久久久久久免费影院 | 性亚洲最疯狂xxxx高清| 国产日本欧美一区二区三区在线| www.中文字幕在线| 日韩视频免费播放| 老司机午夜网站| 国产在线视频网| 国产一区 二区| 久久成人久久爱| 黄网动漫久久久| 国产精品视频26uuu| 色网在线视频| 亚洲国产精品日韩| 成人在线超碰| 一区二区三区**美女毛片| 日韩精品在线电影| 国产成人精品自拍| 中文字幕21页在线看| 成人免费电影网址| 国产精品美女久久久久久久久| 91网站在线观看免费| 91免费看片网站| 激情小视频在线观看| www.999av| 亚洲私拍视频| 国产日韩欧美激情| 成人欧美一区二区三区在线观看| 国产视频一区二区三区在线播放| 免费一区二区三区视频导航| 国产精品精品国产色婷婷| 在线观看中文字幕亚洲| 日韩精品视频久久| 黄色一区二区三区四区| 欧美三级一区二区| 日本一区免费看| 国产精品偷拍| 国产成人精品网址| 国产美女精彩久久| 亚洲 欧美 日韩系列| 国产乱人伦丫前精品视频| 国产精品三级av| 色在人av网站天堂精品| а√天堂中文资源在线bt| 亚洲国产视频a| 中文字幕一区二区三区5566| 天堂√中文最新版在线| 亚洲一区二区中文在线| 国内精品久久国产| 免费在线观看av电影| 1024国产精品| 久久久一本精品99久久精品| 日本国产亚洲| 色综合久久88色综合天天免费| 日韩三级电影网站| 激情开心成人网| 欧美极品少妇xxxxⅹ高跟鞋| 亚洲综合小说区| 琪琪久久久久日韩精品| 欧美不卡一二三| 日日干夜夜操s8| 国产在线不卡一区| 欧美精品免费在线| av在线资源| 一本到不卡精品视频在线观看| 国产欧美一区二区在线播放| 欧美13videosex性极品| 天天爽夜夜爽夜夜爽精品视频| 亚洲天堂电影网| heyzo久久| 国产精品美女在线观看| 日本一区影院| 国产精品小仙女| 日韩一区二区三区高清| 亚洲卡通欧美制服中文| 亚洲午夜精品久久久久久久久久久久| 第九色区av在线| 久久资源免费视频| 久久大香伊蕉在人线观看热2| 欧美日中文字幕| 欧美日韩国产第一页| 精品麻豆一区二区三区| 亚洲综合在线第一页| 女人床在线观看| 99精品久久免费看蜜臀剧情介绍 | 午夜精品美女自拍福到在线| 96久久久久久| 欧美亚州韩日在线看免费版国语版| 深夜福利在线观看直播| 69堂亚洲精品首页| 欧美成人免费高清视频| 国产成人午夜精品影院观看视频| 国产露出视频在线观看| 啪啪亚洲精品| 97人摸人人澡人人人超一碰| 成人黄色一级视频| 欧美影视资讯| 国产欧美123| 亚洲精品www久久久| 国产亚洲短视频| 黄色av免费在线观看| 北条麻妃99精品青青久久| 99国产精品久久一区二区三区| 最近2019年好看中文字幕视频| 四虎永久在线高清国产精品| 中文字幕国产一区| 国精产品一区二区三区有限公司 | 欧美精品一二区| 欧美日韩视频在线一区二区 | 日韩欧美在线网站| 亚洲色图一区二区| 亚洲精品成a人| 91小视频在线观看| 精品国产乱码久久久久久果冻传媒| av大大超碰在线| 日本综合在线| 麻豆传媒在线免费| 四虎精品成人影院观看地址| 美女激情网站| 永久久久久久| 粉嫩av免费一区二区三区| 亚洲性69xxxbbb| 亚洲伦理在线精品| 国产一区二区三区的电影| 中老年在线免费视频| 日韩偷拍一区二区| 久久精品国产91精品亚洲| 精品日韩美女的视频高清| 久久国产免费看| 欧美电影在线观看完整版| 德国一级在线视频| 国产精品aaa| 日韩av在线看| 2023国产一二三区日本精品2022| 中文字幕精品影院| 69堂精品视频在线播放| 久久爱.com| 高清电影在线免费观看| 亚洲精品久久区二区三区蜜桃臀 | 图片区小说区区亚洲影院| av资源亚洲| 免费一级特黄毛片| 亚洲一区二区在线看| 成人字幕网zmw| 国产一区福利视频| 亚洲免费av网| www.xxx亚洲| 在线免费观看av网站| 一区二区三区四区不卡视频 | 亚洲国产精品人人做人人爽| 狠狠久久五月精品中文字幕| 欧美日免费三级在线| 欧美美女网站色| 国产视频综合在线| 国产精品男人的天堂| 国产精品入口免费视| 青青在线免费视频| 日韩av电影免费| 涩涩av在线| 女人丝袜激情亚洲| 最新精品国偷自产在线| 日韩精品视频中文字幕| 国产精品视频首页| 欧美日韩尤物久久| 国产厕拍一区| 大色综合视频网站在线播放| 欧美日韩一区二区三区在线电影| 狂野欧美xxxx韩国少妇| 9999精品免费视频| 尤物在线精品| 成人在线综合网| 亚洲欧洲国产日本综合| av亚洲产国偷v产偷v自拍| www.欧美日韩| 日韩精品色哟哟| 亚洲精品一二三四区| 久久综合九色九九| 97在线观看视频国产| 91精品国产网站| 97高清免费视频| 欧美裸体男粗大视频在线观看| 亚洲精品一区二区在线| 欧美夫妻性生活xx| 精品国产1区2区3区| 久久亚洲成人| 午夜伦理在线| 国产成人天天5g影院在线观看|