国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

第二代InfLLM開源,同尺寸快三倍!零參數(shù),可訓(xùn)練稀疏注意力

人工智能 新聞
InfLLM-V2是一種可高效處理長(zhǎng)文本的稀疏注意力模型,僅需少量長(zhǎng)文本數(shù)據(jù)即可訓(xùn)練,且性能接近傳統(tǒng)稠密模型。通過(guò)動(dòng)態(tài)切換短長(zhǎng)文本處理模式,顯著提升長(zhǎng)上下文任務(wù)的效率與質(zhì)量。從短到長(zhǎng)低成本「無(wú)縫切換」,預(yù)填充與解碼雙階段加速,釋放長(zhǎng)上下文的真正生產(chǎn)力。

長(zhǎng)序列高效處理已成為大模型應(yīng)用的關(guān)鍵。

傳統(tǒng)稠密注意力在序列變長(zhǎng)時(shí)計(jì)算開銷極速增長(zhǎng),直接限制了產(chǎn)品可用性與成本可控性。

為解決這一痛點(diǎn),清華 、OpenBMB 和哈工大提出 InfLLM-V2:一種零額外參數(shù)、訓(xùn)練高效的原生稀疏注意力框架。

InfLLM在短文本場(chǎng)景保持原生高效率,在長(zhǎng)文本場(chǎng)景則切換為稀疏模式,帶來(lái)端到端的顯著加速。

該方法僅用5B的長(zhǎng)文本詞元,即可完成稀疏注意力的訓(xùn)練(而DeepSeek-V3.2-Exp訓(xùn)練了近 1T 詞元的數(shù)據(jù),才完成稀疏注意力的訓(xùn)練)

具體而言,InfLLM-V2相比于稠密注意力機(jī)制可以實(shí)現(xiàn)4倍的速度提升,在長(zhǎng)文本理解任務(wù)上保持98.1%的稠密模型性能,在深思考任務(wù)上保持99.7%的稠密模型性能。

InfLLM有三個(gè)核心優(yōu)勢(shì)

1. 低成本訓(xùn)練:僅需5B長(zhǎng)文本數(shù)據(jù)即可完成稀疏注意力能力的訓(xùn)練,訓(xùn)練成本低,適配周期短。

2. 短到長(zhǎng)無(wú)縫切換、效率雙優(yōu):零新增參數(shù),短序列用稠密、長(zhǎng)序列切換為稀疏,完全對(duì)齊「短序列預(yù)訓(xùn)練-長(zhǎng)序列后訓(xùn)練」的主流范式,訓(xùn)練穩(wěn)定、收斂快。

3. 高效算子實(shí)現(xiàn):針對(duì)稀疏注意力「相關(guān)上下文選擇」(塊選擇)的時(shí)間瓶頸進(jìn)行系統(tǒng)優(yōu)化,提出面向硬件的高效實(shí)現(xiàn),顯著降低HBM I/O與計(jì)算開銷,釋放稀疏注意力的全部潛能。

論文鏈接:https://www.arxiv.org/pdf/2509.24663

模型鏈接:https://huggingface.co/openbmb/MiniCPM4.1-8B

InfLLM-V2如何做到既「強(qiáng)」又「快」

在標(biāo)準(zhǔn) Transformer 的自注意力中,每個(gè)查詢?cè)~元 (Q[t]) 需與全部歷史詞元 (K[:t]) 計(jì)算相似度并參與注意力計(jì)算。

在長(zhǎng)上下文(動(dòng)輒數(shù)十萬(wàn)詞元)時(shí)造成難以承受的時(shí)延與成本。經(jīng)驗(yàn)上,長(zhǎng)序列中絕大多數(shù)遠(yuǎn)距離注意力計(jì)算并非同等重要,注意力矩陣呈現(xiàn)顯著的「稀疏性」(多數(shù)注意力得分接近零)。

如果能僅對(duì)「少量相關(guān)上下文」進(jìn)行計(jì)算,就能顯著降低模型注意力計(jì)算開銷。

稀疏注意力將「每個(gè)查詢?cè)~元都與所有鍵值交互」的稠密范式,替換為「每個(gè)查詢?cè)~元只與一個(gè)選定子集交互」的稀疏范式。

核心包括兩個(gè)步驟:

塊選擇,將上下文拆分為鍵值塊,并為每個(gè)查詢確定需要參與注意力計(jì)算的鍵值子集;

稀疏注意力計(jì)算,僅在被選中的子集上進(jìn)行注意力計(jì)算。

可訓(xùn)練的稀疏注意力在模型訓(xùn)練過(guò)程中即引入稀疏機(jī)制,能夠系統(tǒng)性地提升模型在長(zhǎng)文本場(chǎng)景下的效率與質(zhì)量。

然而,現(xiàn)有代表性方法主要為 DeepSeek提出的NSA架構(gòu)。

NSA雖然采用了成熟的塊稀疏結(jié)構(gòu)并配套專用CUDA內(nèi)核,但其架構(gòu)與主流的「短序列預(yù)訓(xùn)練—長(zhǎng)序列微調(diào)」范式存在明顯錯(cuò)配:引入三套獨(dú)立的 KV 緩存與三種注意力分支,在「長(zhǎng)序列微調(diào)」中將使得模型收斂不穩(wěn),并且對(duì)短序列場(chǎng)景增加了大量的額外開銷。

針對(duì)上述痛點(diǎn),InfLLM-V2 提出「零額外參數(shù)、長(zhǎng)短無(wú)縫切換」 的可訓(xùn)練稀疏路徑,在不改變?cè)凶⒁饬?shù)的前提下,完成從稠密到稀疏的平滑切換。

無(wú)縫短長(zhǎng)切換:僅用一套共享鍵值緩存(零額外參數(shù)),把 NSA 多分支并為單一分支;與稠密注意力在參數(shù)與計(jì)算方式上完全對(duì)齊,按序列長(zhǎng)度動(dòng)態(tài)切換稠密/稀疏,訓(xùn)練更穩(wěn)。

長(zhǎng)短序列效率雙優(yōu):短文本直接使用稠密注意力機(jī)制,零額外開銷與性能回退;長(zhǎng)文本用統(tǒng)一的稀疏范式,prefill 與 decode 全鏈路提速。

硬件友好的塊選擇:基于 MLP 的塊壓縮操作修改為無(wú)參數(shù)池化操作;壓縮注意力(圖中Compressed Attetntion)修改為僅生成選擇分?jǐn)?shù),計(jì)算 Top-K;配合 GQA 組內(nèi)共享 Top-K,實(shí)現(xiàn)了更優(yōu)的計(jì)算 Kernel 融合,避免塊選擇代替稀疏注意力成為效率瓶頸。

在以上技術(shù)的支持下,InfLLM-V2僅需使用5B詞元即可實(shí)現(xiàn)稀疏注意力模型的訓(xùn)練!

與DeepSeek Sparse Attention對(duì)比

值得注意的是,在9月29日,DeepSeek-V3.2-Exp中提出了NSA的升級(jí)版 —— DeepSeek Sparse Attention(DSA)。

DSA拋棄了NSA中三套獨(dú)立KV緩存與三種注意力分支的設(shè)計(jì),并在后訓(xùn)練階段引入稀疏注意力算法。

實(shí)驗(yàn)結(jié)論

研究人員基于MiniCPM4的基座模型,在長(zhǎng)文本理解與深思考任務(wù)上對(duì)比了不同稀疏注意力算法的效果。

長(zhǎng)文本理解任務(wù)

在長(zhǎng)文本理解任務(wù)RULER、LongBench與LongPPL評(píng)測(cè)中,InfLLM-V2實(shí)現(xiàn)了與稠密注意力模型完全可比的性能,展現(xiàn)了InfLLM-V2的優(yōu)越性。其他稀疏注意力方法一定程度上都會(huì)導(dǎo)致模型性能下降。

NSA方法新增了大量參數(shù),在少量的長(zhǎng)文本訓(xùn)練后,無(wú)法讓模型捕捉到長(zhǎng)上下文中的前后語(yǔ)義關(guān)聯(lián)。

深思考任務(wù)

在數(shù)學(xué)、代碼深思考任務(wù)中,InfLLM-V2能夠?qū)崿F(xiàn)與稠密注意力可比的性能,而 NSA 方法卻對(duì)模型效果有著較大的損害。

隨著愈來(lái)愈多的任務(wù)要求模型進(jìn)行更深入的推理與分析,「如何高效加速模型的思考過(guò)程」已成為當(dāng)下的重要研究方向。InfLLM-V2充分展現(xiàn)了稀疏注意力在深思考場(chǎng)景下的潛力。

效率評(píng)測(cè)

研究人員在A100與4090兩款芯片上對(duì)InfLLM-V2進(jìn)行了推理效率評(píng)測(cè)。

結(jié)果表明,InfLLM?V2相對(duì)稠密注意力可獲得顯著加速,在128K長(zhǎng)文本中,InfLLM-V2 可實(shí)現(xiàn)4-9倍算子加速比。

分解分析與消融實(shí)驗(yàn)表明,高效塊選擇設(shè)計(jì)是關(guān)鍵加速來(lái)源。

端到端評(píng)測(cè)中,InfLLM?V2在prefill與decode分別實(shí)現(xiàn)約2.1×與2.3×加速。

算子速度測(cè)評(píng)


端到端速度測(cè)評(píng)

首個(gè)開源原生稀疏注意力模型

MiniCPM4/MiniCPM4.1

在今年6月,OpenBMB聯(lián)合清華提出了InfLLM-V2架構(gòu),并基于該架構(gòu)共同發(fā)布了首個(gè)開源的原生稀疏注意力模型MiniCPM4,并在9月初開源了混合思考版本MiniCPM4.1

MiniCPM4.1在眾多深思考任務(wù)上取得綜合平均分同尺寸模型第一。

MiniCPM4.1充分利用稀疏注意力、投機(jī)采樣等高效算法,在LiveCodeBench、AIME等代碼、數(shù)學(xué)推理的測(cè)試中,推理速度比Qwen3-8B等同尺寸開源模型快3倍以上。

研究人員表示,將持續(xù)優(yōu)化InfLLM-V2的訓(xùn)練算子與推理算子,將InfLLM-V2集成至SGLang等主流推理框架中。

同時(shí),為了促進(jìn)稀疏注意力機(jī)制的研究,也將陸續(xù)開源論文中使用到的基座模型(Base模型)與長(zhǎng)文本訓(xùn)練數(shù)據(jù)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2009-02-13 16:54:50

EMCSSDSymmetrix

2012-05-15 18:04:57

Trinity

2019-09-30 07:10:08

第二代云計(jì)算IT專業(yè)人員

2019-10-08 11:49:06

第二代云計(jì)算多云

2013-12-12 15:36:35

亞馬遜

2015-02-02 13:15:59

2011-08-30 17:29:55

2013-05-03 09:44:02

Surface平板

2011-12-11 23:19:21

2014-10-18 13:53:26

2021-04-20 10:30:43

區(qū)塊鏈安全互聯(lián)網(wǎng)

2020-08-13 10:50:55

Graphcore

2012-05-08 13:18:42

流控引擎流控

2012-08-08 11:02:54

Surface微軟

2015-08-24 10:18:05

2010-01-27 18:12:55

2013-04-19 11:08:57

E-Band微波LTE移動(dòng)通信網(wǎng)絡(luò)

2014-04-17 10:24:42

2014-10-30 09:40:13

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

a日韩av网址| av动漫在线播放| 色哟哟免费在线观看| xf在线a精品一区二区视频网站| 4k岛国日韩精品**专区| 欧洲av一区二区嗯嗯嗯啊| 理论片播放午夜国外| 婷婷另类小说| 欧美色综合影院| 国产精品视频网站在线观看| 一区二区小说| 精品香蕉在线观看视频一| 88av.com| 亚洲黄色影片| 精品国产污污免费网站入口 | 亚洲成人福利在线观看| 日韩精品乱码av一区二区| 成人国产精品久久久| 美女毛片一区二区三区四区最新中文字幕亚洲 | 日韩精品三区四区| 午夜激情av在线| 欧美精品一级二级三级| 2018av男人天堂| 一区二区中文字幕在线| 777永久免费网站国产| 国产精品不卡视频| 白天操夜夜操| 亚洲资源中文字幕| 人人超碰在线| 欧美性大战久久久久久久 | www.亚洲免费av| 成年女人18级毛片毛片免费| 国产精品1区2区3区在线观看| 99精品一级欧美片免费播放| 亚洲专区一区| 日韩精品一线二线三线| 久久精品国产一区二区三| 久久久99精品视频| 久久久99免费| www浪潮av99com| 亚洲婷婷在线视频| 丝袜+亚洲+另类+欧美+变态| 欧美日韩国产综合视频在线观看| 在线免费观看黄色av| 日韩欧美久久久| 五月激情久久| 久久久在线免费观看| 欧美激情欧美| 美女精品导航| 正在播放一区二区| 亚洲电影在线播放| 国产九色porn网址| 欧美体内谢she精2性欧美| 韩日视频在线| 欧美精品久久久久久久久老牛影院 | 日韩欧美亚洲v片| 日本成人在线电影网| 久久中文字幕二区| 91精品网站| 久久精品国产成人一区二区三区 | 久久久噜噜噜www成人网| 亚洲毛片av在线| 国产一级在线观看| 一区二区三区四区在线观看视频| 日韩电影不卡一区| 日本一区二区精品| 国产精品欧美一级免费| 免费黄色电影在线观看| 色综合久久悠悠| 一本色道久久综合亚洲精品高清| 亚洲激情在线观看| 亚洲电影一区| 91精品久久久久久久久久另类 | 欧美日韩国产在线一区| 日韩性生活视频| 三级精品视频| 亚洲精品国产精品国自产| 中文字幕一区二区三区精华液 | 色94色欧美sute亚洲线路一久| 在线免费av资源| 日本成人黄色片| 蜜臀久久99精品久久久久宅男| 最近中文字幕一区二区| 欧美一区二区高清| 婷婷亚洲精品| 久久99国产精品一区| 日韩欧美一区二区三区久久| 亚洲色图图片| 欧美国产二区| 夜夜亚洲天天久久| 国产精品久久久久77777丨| 97人摸人人澡人人人超一碰| 久久理论电影网| 污的网站在线观看| 成人av电影天堂| 91视频国产观看| av2020不卡| 成人国产精品av| 欧美韩国日本不卡| 芒果视频成人app| 久久久一本精品99久久精品| 亚洲尤物在线视频观看| 99re在线视频观看| 久久久美女艺术照精彩视频福利播放| 国产免费视频在线| 久久免费成人精品视频| 国产一区二区伦理片| 在线看的av网站| 国产精品69久久| 91丝袜国产在线播放| а√天堂中文在线资源8| 国产精品18毛片一区二区| 亚洲精品中文字幕在线观看| 日韩电影免费观| 午夜精品一区二区三区在线观看| 在线日韩国产精品| 欧美超碰在线| 色琪琪丁香婷婷综合久久| 色综合久久悠悠| 国产福利一区二区三区在线视频| 国产超级va在线视频| 99精品国产高清在线观看| 亚洲6080在线| 欧美亚洲高清| 天天草夜夜草| 国产精品va在线播放| 999国产精品| 国产无遮挡又黄又爽免费网站| 色系列之999| 国内精品免费**视频| 黄色漫画在线免费看| 色女孩综合网| 欧美一区二区三区视频在线| 亚洲激情一区| av资源网站在线观看| 99热99热| 欧美日韩亚洲国产综合| 亚洲精品1区2区| 国产盗摄在线观看| 相泽南亚洲一区二区在线播放| 日韩一区二区麻豆国产| 丝袜亚洲另类欧美| gogo高清在线播放免费| 中文字幕中文字幕一区三区| 日韩毛片在线观看| 国产成人自拍在线| 亚洲精品三区| 男女羞羞视频教学| 91久久精品视频| 欧美精品 日韩| 黄网站免费久久| 99tv成人影院| 免费播放av| yy111111少妇影院日韩夜片| 欧美一区二区黄| 国产69精品久久久久毛片| 我要色综合中文字幕| 好吊的妞视频这里都有| 91在线免费看片| 精品av综合导航| 99精品热视频| 在线看成人短视频| 国产福利免费在线观看| 日本一区不卡| 日韩在线中文字| 一区二区三区精品在线观看| 亚洲午夜视频| 欧美××××黑人××性爽| 色乱码一区二区三区在线| 92国产精品久久久久首页| 精品美女被调教视频大全网站| 粉嫩嫩av羞羞动漫久久久| 伊甸园亚洲一区| 黄色视屏免费在线观看| 欧美日韩精品在线一区二区| 国产精品私拍pans大尺度在线 | 理论视频在线观看| 国产经品一区二区| 亚洲少妇中文在线| 日韩码欧中文字| 99视频精品| 麻豆国产一区二区三区四区| 亚洲成人av高清| 成人午夜视频免费观看| 日本一欧美一欧美一亚洲视频| 日本免费新一区视频| 成人国产激情在线| 最新av电影| 中文字幕免费高| 国产91九色视频| 精品av综合导航| 亚洲男人的天堂在线aⅴ视频| 蜜桃av综合| 色婷婷综合久久久久久| 麻豆福利在线观看| 国产午夜视频| 欧美一级爱爱视频| 999视频在线观看| 欧美成人免费观看| 日韩精品一区二区三区视频|