国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Llama 3低比特量化性能下降顯著!全面評估結果來了 | 港大&北航&ETH

人工智能
研究人員使用現有的10種訓練后量化和LoRA微調方法,評估了LLaMA3在1-8比特和各種評估數據集上的結果。他們發現:盡管性能令人印象深刻,LLaMA3在低比特量化下仍然遭受了不可忽視的退化,特別是在超低位寬上。

大模型力大磚飛,讓LLaMA3演繹出了新高度:

超15T Token數據上的超大規模預訓練,既實現了令人印象深刻的性能提升,也因遠超Chinchilla推薦量再次引爆開源社區討論。

圖片

與此同時,在實際應用層面上,另一個熱點話題也浮出水面:

資源有限場景下,LLaMA3的量化表現又會如何?

香港大學、北京航空航天大學、蘇黎世聯邦理工學院聯合推出了一項實證研究,全面揭示了LLaMA3的低比特量化性能。

圖片

研究人員使用現有的10種訓練后量化和LoRA微調方法,評估了LLaMA3在1-8比特和各種評估數據集上的結果。他們發現:

盡管性能令人印象深刻,LLaMA3在低比特量化下仍然遭受了不可忽視的退化,特別是在超低位寬上。

圖片

項目已在GitHub上開源,量化模型也已登陸HuggingFace。

具體來看實證結果。

軌道1:訓練后量化

表1和表2中分別提供了LLaMA3-8B和LLaMA3-70B在8種不同的PTQ方法下的低比特性能表現,覆蓋了從1比特到8比特的廣泛比特寬度。

1.低比特權重

其中,Round-To-Nearest (RTN) 是一種基本的舍入量化方法。

GPTQ是當前最有效率和有效的僅限權重的量化方法之一,它利用量化中的誤差補償。但在2-3比特下,當量化LLaMA3時,GPTQ會導致嚴重的準確性崩潰。

AWQ采用異常通道抑制方法來降低權重量化的難度,而QuIP通過優化矩陣計算來確保權重和Hessian之間的不一致性。它們都能保持LLaMA3在3比特時的能力,甚至將2比特量化推向有希望的水平。

2.超低比特權重

最近出現的二值化LLM量化方法實現了超低比特寬度LLM權重壓縮。

PB-LLM采用混合精度量化策略,保留一小部分重要權重的全精度,同時將大部分權重量化為1比特。

DB-LLM通過雙重二值化權重分割實現高效的LLM壓縮,并提出偏差感知蒸餾策略以進一步增強2比特LLM性能。

BiLLM通過顯著權重的殘差逼近和非顯著權重的分組量化,進一步將LLM量化邊界推低至1.1比特。這些為超低比特寬度專門設計的LLM量化方法可以實現更高精度的量化LLaMA3-8B,在?2比特時遠遠超過如GPTQ、AWQ和QuIP等方法,在2比特(甚至在某些情況下3比特)下的表現。

3.低比特量化激活

還通過SmoothQuant對量化激活進行了LLaMA3評估,SmoothQuant將量化難度從激活轉移到權重,以平滑激活異常值。評估顯示,SmoothQuant可以在8比特和6比特的權重和激活下保留LLaMA3的準確性,但在4比特時面臨崩潰。

圖片
圖片

軌道2:LoRA微調量化

在MMLU數據集上,對于LoRA-FT量化下的LLaMA3-8B,最顯著的觀察是,在Alpaca數據集上低秩微調不僅不能補償量化引入的錯誤,甚至使性能下降更加嚴重。

具體來說,各種LoRA-FT量化方法在4比特下獲得的量化LLaMA3性能,比沒有使用LoRA-FT的4比特對應版本要差。這與LLaMA1和LLaMA2上的類似現象形成鮮明對比,在LLAMA1和LLAMA2中,4比特低秩微調量化版本甚至能輕松超過MMLU上的原始FP16對應版本。

根據直觀分析,這一現象的主要原因是由于LLaMA3強大的性能得益于其大規模的預訓練,這意味著原始模型量化后的性能損失不能通過在一小部分低秩參數數據上進行微調來補償(這可以被視為原始模型的一個子集)。

盡管量化導致的顯著下降不能通過微調來補償,但4比特LoRA-FT量化的LLaMA3-8B在各種量化方法下顯著優于LLaMA1-7B和LLaMA2-7B。例如,使用QLoRA方法,4比特LLaMA3-8B的平均準確率為57.0(FP16: 64.8),超過4比特LLaMA1-7B的38.4(FP16: 34.6)18.6,超過4比特LLaMA2-7B的43.9(FP16: 45.5)13.1。這表明在LLaMA3時代需要一種新的LoRA-FT量化范式。

在CommonSenseQA基準測試中也出現了類似的現象。與沒有使用LoRA-FT的4比特對應版本相比,使用QLoRA和IR-QLoRA微調的模型性能也有所下降(例如,QLoRA平均下降2.8% vs IR-QLoRA平均下降2.4%)。這進一步展示了在LLaMA3中使用高質量數據集的優勢,而且通用數據集Alpaca并沒有對模型在其他任務中的性能作出貢獻。

結論

這篇論文全面評估了LLaMA3在各種低比特量化技術(包括訓練后量化和LoRA微調量化)中的性能。

此研究發現表明,盡管LLaMA3在量化后仍然展現出優越的性能,但與量化相關的性能下降是顯著的,甚至在許多情況下可以導致更大的下降。

這一發現突顯了在資源受限環境中部署LLaMA3可能面臨的潛在挑戰,并強調了在低比特量化背景下增長和改進的充足空間。通過解決低比特量化引起的性能下降,預期后續的量化范式將使LLMs在較低的計算成本下實現更強的能力,最終推動代表性的生成式人工智能達到新的高度。

論文鏈接:https://arxiv.org/abs/2404.14047。

項目鏈接:https://github.com/Macaronlin/LLaMA3-Quantizationhttps://huggingface.co/LLMQ。

責任編輯:姜華 來源: 量子位
相關推薦

2023-05-11 11:53:35

模型評測

2024-05-27 09:16:37

2025-05-06 13:42:16

微軟Phi-4模型

2025-01-17 09:20:00

2024-07-19 13:31:41

2024-05-30 13:10:10

2023-11-17 22:55:09

量化模型

2010-08-04 10:02:30

BMCIBM大型機

2024-07-11 11:53:56

2025-06-03 09:16:00

2025-07-11 08:54:00

2009-07-24 11:43:26

PAL虛擬化性能組件

2024-11-08 10:00:00

AI模型

2023-04-10 10:32:00

模型排序

2024-06-03 08:30:00

2024-07-29 09:10:00

模型數據

2024-01-12 17:25:45

MoE模型開源人工智能

2020-05-16 12:18:29

安卓統一推送消息

2025-01-13 07:00:00

2023-06-08 11:27:10

模型AI
點贊
收藏

51CTO技術棧公眾號

国产亚洲精品久久久久久久| 2018av男人天堂| 欧美aaaaaaaa牛牛影院| 亚洲人成在线观| 国产三级伦理在线| 日韩欧美亚洲另类制服综合在线| 精东影业在线观看| 一区二区三区在线观看视频| 校园春色 亚洲色图| 国产久卡久卡久卡久卡视频精品| 精品国产乱码久久久久| 欧美日韩伊人| 国产精品久久国产精品| 亚洲色图插插| 亚洲精品日韩av| 亚洲国产精品成人| 91精品国自产在线观看| 91超碰成人| 91人成网站www| 欧美黄色一区| 不卡一卡2卡3卡4卡精品在| 欧美一区在线看| 国产区一区二区三区| 1024成人| 亚洲一卡二卡三卡| 国产精品99久久久久久久女警 | 日本久久91av| 另类春色校园亚洲| 97色在线视频观看| 精品在线播放| 国产一区二区视频在线观看| 一区二区三区四区电影| 精品产品国产在线不卡| 免费精品视频最新在线| 日本大片免费看| 91网站最新网址| 先锋成人影院| 婷婷成人综合网| 尤物在线视频| 亚洲精品国产精品国自产观看浪潮| 伊人久久在线| 九九热精品视频国产| 在线日韩网站| 国产亚洲欧美另类一区二区三区| 日韩成人一级大片| 精品少妇一区二区三区在线| 最新热久久免费视频| 中文在线观看视频| 欧美一级高清片| 成人全视频免费观看在线看| 91成人性视频| 在线国产欧美| 屁屁影院ccyy国产第一页| 国产欧美视频在线观看| 麻豆电影在线观看| 日韩写真欧美这视频| 性欧美18~19sex高清播放| 欧美激情a在线| 欧美伊人影院| 久久精品国产sm调教网站演员| 亚洲图片激情小说| 麻豆视频网站在线观看| 日韩在线一区二区三区免费视频| 一道在线中文一区二区三区| 精品一区二区三区免费毛片| 久久日一线二线三线suv| 九色在线观看| 色偷偷88888欧美精品久久久| 日韩1区2区| 中文字幕の友人北条麻妃| 一区二区视频免费在线观看| 日本一级理论片在线大全| 欧美人在线视频| 欧美午夜不卡| 能看的毛片网站| 欧美一区二区在线免费播放 | 伊甸园亚洲一区| 欧美日韩亚洲一区二区三区四区| 91女神在线视频| 国内精品一区视频| 日日摸夜夜添一区| 自拍欧美日韩| 99视频在线免费| 日韩免费视频一区二区| 林ゆな中文字幕一区二区| 欧美高清性xxxxhd| 夜夜嗨av一区二区三区网页 | 激情综合网站| 欧美 日韩 亚洲 一区| 欧洲日韩一区二区三区| **爰片久久毛片| 色姑娘综合av| 婷婷开心激情综合| 北条麻妃一区二区三区在线观看| 日韩精品一线二线三线| 亚洲成年人影院| 91成人小视频| 亚洲国产一区二区三区在线| 午夜私人影院久久久久| 久久精品66| www.国产在线播放| 精品少妇一区二区三区| 尹人成人综合网| 在线观看国产福利视频| 51精品在线观看| 国产蜜臀97一区二区三区| 99久久伊人| 91精品国产吴梦梦| 日韩欧美高清在线| 欧美日本一区二区视频在线观看| 国产真实生活伦对白| 日韩在线中文字| 国产自产2019最新不卡| 91极品在线| 久久亚洲高清| 欧美亚洲自拍偷拍| 欧美激情精品久久久六区热门| 日本一区二区三区电影| 97视频免费在线看| 久久久国产精品不卡| 97精品国产99久久久久久免费| 一区二区不卡在线观看| 日韩欧美一级精品久久| 精品动漫一区| 国产在线高清| 亚洲一区二区日本| 亚洲成人久久影院| 日韩精品影视| 福利资源在线久| 国产精品一区久久| 亚洲成av人片在线| 91av精品| 黄色一级片在线观看| 久久综合入口| 欧美一区二区三区不卡| 亚洲经典在线| 欧美卡一卡二| 中文字幕不卡每日更新1区2区| 日韩高清中文字幕| 国产福利电影一区二区三区| 免费观看成人性生生活片| 久久久久久久久久伊人| 在线性视频日韩欧美| 91色porny蝌蚪| 韩国女主播一区二区三区| 福利在线白白| 亚洲综合色av| 欧美一级高清片在线观看| 激情六月婷婷综合| 秋霞一区二区| 丝袜美女写真福利视频| 147欧美人体大胆444| 欧美一区二区三区的| 国产精品主播直播| 91亚洲无吗| 在线免费日韩| 久久涩涩网站| 一区二区三区美女xx视频| 久久久91精品国产一区二区精品 | 亚洲欧美日韩精品一区二区 | 精品国内亚洲2022精品成人| 午夜影院免费| 九九九九精品| 一区二区中文字幕| 国产女人aaa级久久久级| 欧美呦呦网站| 黄色免费在线看| 久久国产精品网| 国产激情久久久| 制服丝袜国产精品| 国产成人免费av在线| 亚州av一区| 日本不卡三区| 日韩视频免费播放| 国产精品三级美女白浆呻吟| 欧美一区欧美二区| 国产日韩欧美一区二区三区综合| 亚洲精品一二三区区别| 在线视频cao| 成r视频免费观看在线播放| 深田咏美在线x99av| 久久久久久久久久久免费| 在线免费观看一区| 91日韩在线专区| 在线观看的日韩av| 欧美日本三级| 日本精品在线| 国产九九在线视频| 日本高清不卡三区| 26uuu另类亚洲欧美日本一| 91麻豆精品国产91久久久久久久久 | 欧美日韩视频在线一区二区观看视频| 欧美一区二区三区色| 91在线免费视频观看| 欧美三区在线| 二区三区精品| 国产精品视频二区三区| 国产av麻豆mag剧集| 国产伦精品一区二区三区四区视频 | 久久精品日韩精品|