国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

單卡搞定Llama 3.1 405B,讓大模型輕松瘦身!超強壓縮工具包來了

人工智能 新聞
北航、商湯、南洋理工等團隊聯合推出的大模型壓縮工具與基準LLMC,能很好解決這一問題。

單卡搞定Llama 3.1(405B),最新大模型壓縮工具來了!

最近Llama-3.1登上開源頂峰,但其最強的405B版本模型900多GB的內存需求,對資源構成了更加苛刻的挑戰。

北航、商湯、南洋理工等團隊聯合推出的大模型壓縮工具與基準LLMC,能很好解決這一問題。

它使得一張80G A100即可完成Llama 3.1 405B的校準和評估,從而實現以超低成本進行量化。

它支持多種壓縮算法、模型和推理后端,具有強大的擴展性和全方位的評估能力。

圖片

目前,研究團隊已將使用方法放在GitHub主頁上,戳文末鏈接即可獲取。

Llama3.1 更大也更難壓縮

低比特量化是解決資源受限問題的通用技術之一。為此,相關研究人員運用了LLMC對Llama 3.1進行了量化壓縮。

結果如表1所示,采用LLMC中的某些算法,例如QuaRot和AWQ等算法在70B和405B參數量的模型上,均能有效保持量化精度。而最為簡單的“四舍五入”(Naive)算法在這些大規模模型上則表現出顯著的精度下降,特別是在激活被量化的情況下。

圖片

該研究團隊發現,Llama 3.1系列模型的量化精度下降現象,源于其激活張量中存在一些相比其他模型更顯著的離群值或異常值(outliers)。隨著Llama 3.1模型體積的增大,這些離群值的現象更加嚴重。離群值是指在數據中某些數值與其他數值相比差異較大的點,是影響量化精度的關鍵因素之一。

借助LLMC工具,研究團隊對Llama 3.1系列模型(8B、70B、405B)的第一個block的4層(q_proj、o_proj、gate_proj、down_proj)輸入激活張量進行了可視化(如圖1-3所示)。每個子圖底部展示了該層激活值的所有token的Kurtosis值的平均值和標準差。

圖片
圖片
圖片

由圖1-3可以發現,在Llama 3.1系列的模型中,激活張量的一些channel中存在outlier,而且在越大的模型中,這個現象更明顯。

因此,可以合理推斷:Llama 3.1 405B模型雖然變強了,但也變得更加“異常”,更難被量化

LLMC工具中支持一系列關于抑制大模型異常值的量化算法,包括AWQ、SmoothQuant、OS+、QuaRot等。由表1可以看到,這些方法通過有效抑制outlier,大大提升了Llama 3.1的量化精度。例如,在405B模型W8A8量化上,SmoothQuant、OS+、QuaRot幾乎可以取得與浮點模型相當的精度表現。

LLMC:一站式大模型瘦身工具包

圖片

△LLMC框架圖

支持多種算法。LLMC 支持多種壓縮算法,包括 16 種不同的量化方法,涵蓋僅權重、權重激活和混合精度量化。這種多樣性允許對不同方法進行公平比較和深入分析。當然除了量化,目前還支持各種類型的稀疏以及相關算法。

圖片

△LLMC目前支持的部分硬件友好壓縮算法分類

精度高度對齊。LLMC團隊進行了若干對齊實驗,比較了幾種已建立的量化算法(LLMC與原始論文/代碼)。

實驗設置與原始論文中的設置或其開源代碼的默認設置相同(如表3所示)。

這些實驗結果總結在表4-6中。表中的結果表明,LLMC工具在性能上幾乎與文獻中報道的原始量化算法一致。通過這些實驗,證明了LLMC不僅有效,而且在重現現有量化方法的結果方面也是可靠的。這確保了該工具對LLM量化研究的貢獻是可信且有價值的。

圖片
圖片

以超低成本進行量化。LLMC工具包旨在實現資源高效利用,并且能夠以最低的硬件要求運行大型模型。得益于單block級別的運行機制,僅需要一臺80G A100即可完成Llama 3.1 405B的校準和評估,從而實現以超低成本進行量化。

多后端兼容性。LLMC支持多種量化設置和模型格式,兼容多個后端和硬件平臺,例如LightLLM、TRT-LLM、PPL-LLM、vLLM、MLC-TVM和llama.cpp,具有高度的通用性。

圖片

高擴展性。該工具包高度模塊化和可擴展,能夠輕松適配從整數量化到浮點量化,從密集模型到專家混合(MoE)模型,從LLM到視覺語言模型(VLM),從量化到稀疏化。這種模塊化設計確保用戶可以擴展和自定義工具包,以滿足他們的需求。

圖片
圖片

多樣化評估。LLMC能夠對壓縮模型進行綜合評估,提供詳細的性能指標和分析,例如困惑度(PPL)、數據可視化分析、峰度值(Kurtosis)、誤差和異常值分布。這種全面的評估功能可確保用戶能夠就其模型的最佳壓縮策略做出明智的決策。

圖片

LLMC團隊發布了多功能的大模型壓縮工具包LLMC,支持多種壓縮算法、模型和推理后端,具有強大的擴展性和全方位的評估能力。

該工具包允許用戶僅使用單個GPU即可對千億參數LLM進行壓縮,這極大地方便了LLM量化的應用。配備這款強大的工具包,未來的大模型研究人員以及普通用戶可以為他們的應用程序有效地集成合適的算法和對應后端平臺所需要的格式,從而普及大模型的壓縮應用。

工具地址:https://github.com/ModelTC/llmc
論文地址:https://arxiv.org/abs/2405.06001

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-10-08 15:00:00

2024-07-24 13:18:17

2024-07-23 09:20:35

2024-09-06 13:00:29

2024-08-26 10:00:00

模型數據

2024-07-24 09:20:45

2024-11-21 08:39:08

2024-08-16 14:00:00

2024-11-25 08:10:00

2024-07-24 13:58:25

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2024-09-19 14:00:00

模型開源代碼

2016-04-20 15:36:38

圖片壓縮工具輕量化

2024-12-03 09:24:05

2024-07-29 08:19:00

服務引擎

2024-08-13 13:30:00

2025-10-11 18:05:23

AI大模型工具

2023-02-15 08:26:29

iOS工具
點贊
收藏

51CTO技術棧公眾號

欧美va亚洲va国产综合| 日韩av电影免费| 99久久精品99国产精品| 色婷五月综激情亚洲综合| 欧美日韩国产成人在线91| 日韩午夜视频在线| 国产成人免费电影| 久久久亚洲欧洲日产国码αv| 免费黄色在线视频网站| 久久精品久久久久电影| 欧美特黄一区| 亚洲成色www.777999| 日韩欧美国产午夜精品| 久久99国产成人小视频| 亚洲一区 在线播放| 在线观看亚洲成人| 国产精品超碰| 色撸撸在线观看| 疯狂做受xxxx欧美肥白少妇 | 91精品国产综合久久久久| av软件在线观看| 激情婷婷欧美| 国产精品97在线| 欧美喷潮久久久xxxxx| 久久99国产精品久久99大师| 亚洲看片网站| 欧美日韩精品国产| 最新国产精品精品视频| 亚洲欧洲一二三| 色综合久久久久综合| 99久久人爽人人添人人澡| 日韩视频在线免费播放| 九色porny丨首页入口在线| 日韩久久久久久久| 亚洲成人午夜电影| 亚洲一本二本| 欧美美乳视频网站在线观看| 一个色妞综合视频在线观看| 婷婷丁香久久| 欧美 日韩 国产精品| 欧美高清视频www夜色资源网| 狠狠综合久久av一区二区蜜桃| 欧美 日韩 激情| 亚洲国产成人在线播放| 亚洲激情自拍| 大乳在线免费观看| 91在线免费视频| 国产调教视频一区| 欧美亚洲二区| 黄色一级视频在线播放| 亚洲系列中文字幕| 久久精品官网| 影音先锋在线播放| 欧美久久久久久| 日韩视频在线永久播放| 99蜜桃在线观看免费视频网站| 最近日韩中文字幕| 高清精品xnxxcom| 久久综合伊人77777麻豆最新章节| 亚洲女人初尝黑人巨大| 另类人妖一区二区av| 亚洲精品一线| 翔田千里亚洲一二三区| 欧美大片日本大片免费观看| 日本中文一区二区三区| 欧美人与动牲性行为| 色视频一区二区三区| 亚洲第一中文字幕在线观看| 久久精品国产久精国产爱| 最近高清中文在线字幕在线观看1| 一区二区国产日产| 亚洲人成在线一二| 99精品视频在线观看免费| 国产精品成人3p一区二区三区| 不卡影院一区二区| 91av国产在线| 亚洲国产日韩在线一区模特 | 欧美一级欧美一级在线播放| 免播放器亚洲| 欧美办公室脚交xxxx| 成人一级生活片| 欧美精品在线免费播放| 一色屋精品亚洲香蕉网站| 欧美顶级大胆免费视频| 欧美性videos| 91麻豆天美传媒在线| 久久影院资源网| 亚洲视频一区二区在线| 久久亚洲国产| 永久免费网站在线| 国产精品自拍片| 人妖精品videosex性欧美| 一本色道久久综合亚洲精品按摩| 久久黄色网页| 另类一区二区三区| 免费看黄视频网站| 国产精品精品软件视频| 亚洲男人的天堂网站| 国产三级三级三级精品8ⅰ区| 波多野结衣在线观看一区二区| 国产女主播在线直播| 天天做天天爱天天高潮| 久久久噜噜噜久噜久久| 色婷婷久久一区二区三区麻豆| 日韩综合在线视频| 亚洲精品tv| 狠狠久久亚洲欧美| 亚洲一区二区日韩| 国产成人黄色| 国产大片一区| 好吊妞国产欧美日韩免费观看网站| 欧美调教在线| 欧美一区2区| 国产精品青草久久| 久久国产天堂福利天堂| gogogo高清在线观看免费完整版| 男女激情视频网站| 久久久加勒比| 免费av网站大全久久| 午夜一区二区三区视频| 在线a欧美视频| 国产综合第一页| 嫩草懂你的影院| 无码国模国产在线观看| 国产美女主播视频一区| 欧美一区二区免费视频| 国产精品99免视看9| 91国产在线播放| 免费超爽大片黄| 人人干人人干人人| 在线国产1区| 在线观看美女网站大全免费| 精品国产黄a∨片高清在线| 制服黑丝国产在线| 亚洲国产精品女人| 国产精品久久色| 日韩电影大片中文字幕| 亚洲国产va精品久久久不卡综合| 久久精品免费看| 日韩一级欧美一级| 欧美 日韩 国产精品免费观看| 久久电影tv| 国产最新视频在线| 成年人网站免费视频| 国产美女在线精品免费观看| 欧美极品在线播放| 亚洲激情在线观看| 精品日本美女福利在线观看| 国产不卡一区视频| 一区在线视频| 全国精品免费看| 爱情电影社保片一区| 每日更新在线观看av| 成人免费在线小视频| 茄子视频成人在线观看| 国产欧美在线观看| 久久福利网址导航| 亚洲国语精品自产拍在线观看| 午夜精品福利一区二区蜜股av | 欧美日韩亚洲激情| 国产清纯白嫩初高生在线观看91 | 日韩极品在线观看| 欧美男女爱爱视频| 精品999在线观看| 亚洲免费资源在线播放| 精品精品欲导航| 国产欧美日本在线| 色婷婷久久一区二区| 日韩欧美成人一区| 一本色道久久综合亚洲91| 一区在线观看免费| 久久蜜桃av一区精品变态类天堂| 日韩国产欧美在线播放| 欧美日韩 国产精品| 欧美热在线视频精品999| 久久久91麻豆精品国产一区| 亚洲天堂av影院| av电影在线免费| 超碰公开在线| 亚洲成人三级| 国产裸舞福利在线视频合集| 国产91久久久久蜜臀青青天草二 | 午夜在线一区二区| 一区二区电影在线观看| 国产精品探花在线观看| 大香伊人久久精品一区二区| 亚洲一区av| 成人国产精品久久| 成人久久精品| 亚洲欧美在线人成swag| 国产精品伦一区二区| japanese23hdxxxx日韩| 久久r热视频| 国产亚洲一区二区手机在线观看| yellow字幕网在线| 大菠萝精品导航| 欧美男体视频| 亚洲精品69| 成人自拍在线| 一区三区在线欧|