国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

小米羅福莉新模型突襲炸場(chǎng)!性能媲美Deepseek-v3.2,成本壓榨到極致!羅福莉:中國(guó)開(kāi)源模型與頂尖閉源差距只有數(shù)月

原創(chuàng) 精選
人工智能
在今日上午的小米“人車(chē)家全生態(tài)”合作伙伴大會(huì)上,Xiaomi MiMo大模型負(fù)責(zé)人羅福莉也首秀并介紹了這款最新發(fā)布的大模型。

編輯|聽(tīng)雨

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

中國(guó)開(kāi)源模型再次迎來(lái)一位重磅選手:就在剛剛,小米正式發(fā)布并開(kāi)源新模型 MiMo-V2-Flash。

在今日上午的小米“人車(chē)家全生態(tài)”合作伙伴大會(huì)上,Xiaomi MiMo大模型負(fù)責(zé)人羅福莉也首秀并介紹了這款最新發(fā)布的大模型。

圖片圖片

MiMo-V2-Flash 采用專(zhuān)家混合架構(gòu) (MoE),總參數(shù) 3090 億,活躍參數(shù) 150 億,主打高速推理與智能體工作流,性能媲美 DeepSeek-V3.2、Kimi-K2-Thinking 等頭部開(kāi)源模型。

圖片圖片

最炸裂的是MiMo-V2-Flash的推理速度,達(dá)到了 150 tokens/秒,成本壓到了每百萬(wàn) token 輸入 0.1 美元、輸出 0.3 美元,主打一個(gè)超絕性?xún)r(jià)比。

圖片圖片

MiMo-V2-Flash專(zhuān)為推理、編碼和智能體場(chǎng)景構(gòu)建,各式各樣的網(wǎng)頁(yè)開(kāi)發(fā)也不在話(huà)下,比如一個(gè)炫酷的豪華圣誕樹(shù)3D交互網(wǎng)頁(yè):

圖片圖片

此外,MiMo-V2-Flash 采用 MIT 開(kāi)源協(xié)議,基礎(chǔ)版權(quán)重及技術(shù)報(bào)告均已開(kāi)源。

躋身開(kāi)源模型前兩名,編程能力逼近GPT-5-High

先來(lái)看看跑分情況,MiMo-V2-Flash 在多項(xiàng)主流基準(zhǔn)測(cè)試中表現(xiàn)突出,媲美K2-Thinking和DeepSeek-V3.2。

圖片圖片

在 AIME 2025 數(shù)學(xué)競(jìng)賽 和 GPQA-Diamond 科學(xué)知識(shí)測(cè)試這類(lèi)高難度任務(wù)中,它都穩(wěn)穩(wěn)排進(jìn)開(kāi)源模型前兩名,推理能力已經(jīng)站到第一梯隊(duì)。


圖片圖片

它的編程成績(jī)也讓人眼前一亮。在被公認(rèn)為“最接近真實(shí)世界開(kāi)發(fā)”的 SWE-bench Verified 測(cè)試中,MiMo-V2-Flash 拿下 73.4% 的通過(guò)率,直接刷新開(kāi)源模型紀(jì)錄,整體表現(xiàn)已經(jīng)逼近 GPT-5-High。要知道,這個(gè)測(cè)試不是寫(xiě)小腳本,而是讓模型去修真實(shí)項(xiàng)目里的 bug。73.4% 的成功率,意味著它已經(jīng)能解決絕大多數(shù)實(shí)際編程問(wèn)題。

放到多語(yǔ)言場(chǎng)景,MiMo-V2-Flash 同樣不虛。在 SWE-Bench Multilingual 中,它的解題成功率達(dá)到 71.7%,說(shuō)明不管是 Python、Java 還是其他語(yǔ)言,都具備穩(wěn)定的工程能力。

再看智能體任務(wù),這也是它的重點(diǎn)優(yōu)勢(shì)之一。

在 τ2-Bench 中,MiMo-V2-Flash 在通信、零售、航空三類(lèi)任務(wù)里分別拿到 95.3、79.5 和 66.0 的高分;在 BrowseComp 搜索代理測(cè)試中,基礎(chǔ)得分為 45.4,開(kāi)啟上下文管理的情況下,成績(jī)直接躍升到 58.3。這說(shuō)明它不僅能“回答問(wèn)題”,還能在多輪交互中持續(xù)理解目標(biāo)、做決策、完成任務(wù)。

此外,它的寫(xiě)作和表達(dá)質(zhì)量也接近頂級(jí)閉源模型水準(zhǔn)。這是MiMO-V2-Flash即興創(chuàng)作的小說(shuō),看起來(lái)筆觸還是相當(dāng)細(xì)膩的:

圖片圖片

三項(xiàng)黑科技:SWA、輕量級(jí)MTP和后訓(xùn)練MOPD

MiMo-V2-Flash 能做到推理性能的極致性?xún)r(jià)比,其核心來(lái)自一系列專(zhuān)門(mén)為高吞吐推理設(shè)計(jì)的架構(gòu)創(chuàng)新。

  • 混合滑動(dòng)窗口注意力機(jī)制

MiMo-V2-Flash 采用了一種 1:5 的混合注意力設(shè)計(jì):少量全局注意力,搭配大量 滑動(dòng)窗口注意力(Sliding Window Attention,SWA)。大量實(shí)驗(yàn)結(jié)果表明,SWA 結(jié)構(gòu)簡(jiǎn)單、效率高、易落地,在通用任務(wù)、長(zhǎng)上下文處理以及復(fù)雜推理任務(wù)上,整體表現(xiàn)都優(yōu)于線性注意力。


圖片圖片

更重要的是,SWA 使用固定大小的 KV Cache,這意味著它可以非常順滑地接入現(xiàn)有的訓(xùn)練和推理基礎(chǔ)設(shè)施,不需要大規(guī)模重構(gòu)工程體系。

羅福莉還指出:窗口大小 128 是關(guān)鍵數(shù)值。實(shí)驗(yàn)證明,盲目擴(kuò)大窗口(如增至 512)反而會(huì)導(dǎo)致性能下降。同時(shí)她強(qiáng)調(diào),在實(shí)施該機(jī)制時(shí),sink values 是維持性能的關(guān)鍵,絕不可省略。

圖片圖片

  • 輕量級(jí)多 Token 預(yù)測(cè) (MTP)

傳統(tǒng)大模型解碼,本質(zhì)上是一個(gè)強(qiáng)內(nèi)存受限的過(guò)程:算力并沒(méi)有完全吃滿(mǎn),瓶頸往往卡在 KV Cache 的讀寫(xiě)上。

而MTP讓模型一次性預(yù)測(cè)多個(gè)候選 token、,然后由主模型并行驗(yàn)證這些 token 是否可接受。這樣一來(lái),F(xiàn)FN 和 Attention 的算術(shù)強(qiáng)度都被同時(shí)拉高,卻不增加 KV Cache 的 I/O 壓力,真正實(shí)現(xiàn)了 token 級(jí)并行。

在 MiMo-V2-Flash 中,MTP 不是外掛模塊,而是原生能力,直接作為自推測(cè)解碼的草稿模型使用,帶來(lái)了實(shí)打?qū)嵉牟渴鸺?jí)加速效果。

為了避免 MTP 本身變成新的性能瓶頸,MiMo-V2-Flash 對(duì) MTP 模塊做了非常克制的設(shè)計(jì):

  • 使用 Dense FFN(而非 MoE),控制參數(shù)規(guī)模
  • 使用 SWA 而非 GA,進(jìn)一步降低 KV Cache 和注意力計(jì)算成本
  • 模塊整體保持輕量,但不犧牲預(yù)測(cè)質(zhì)量

圖片圖片

結(jié)果也很漂亮。據(jù)羅福莉介紹,在三層 MTP 設(shè)置下,他們觀察到平均接受長(zhǎng)度超過(guò) 3,編碼任務(wù)速度提升約 2.5 倍。它有效解決了小批量 On-Policy 強(qiáng)化學(xué)習(xí)中「長(zhǎng)尾樣本」帶來(lái)的 GPU 空閑時(shí)間浪費(fèi)問(wèn)題。

圖片圖片

  • MOPD:一種全新的后訓(xùn)練范式

在后訓(xùn)練階段,小米還整了個(gè)新活:多教師在線策略蒸餾(MOPD)

MOPD 的核心,是一種高效的 on-policy 學(xué)習(xí)機(jī)制。具體來(lái)說(shuō),研究者先通過(guò) SFT / RL 訓(xùn)練出多個(gè)領(lǐng)域?qū)<壹?jí)教師模型,隨后讓學(xué)生模型直接從自身策略分布中進(jìn)行采樣(rollout),并利用來(lái)自多個(gè)教師模型提供的、細(xì)粒度到 token 級(jí)別的密集獎(jiǎng)勵(lì)信號(hào)進(jìn)行優(yōu)化。

圖片圖片

最驚人的是效率提升,MOPD 只需要傳統(tǒng)方法 1/50 的算力,就能讓學(xué)生模型達(dá)到教師性能峰值。這意味著小米能用更少的資源,更快地迭代模型。

羅福莉表示,這個(gè)方法借鑒于Thinking Machine,將多個(gè)強(qiáng)化學(xué)習(xí)模型進(jìn)行融合,結(jié)果帶來(lái)了驚人的效率提升。這為構(gòu)建一個(gè)自我強(qiáng)化循環(huán)系統(tǒng)奠定了基礎(chǔ),學(xué)生模型可以逐步進(jìn)化,最終成為更強(qiáng)的教師模型。

圖片圖片

屬于開(kāi)源模型的「小米時(shí)刻」,來(lái)了

在今天上午的小米“人車(chē)家全生態(tài)”合作伙伴大會(huì)上,羅福莉表示:

“2020年我剛進(jìn)入這行的時(shí)候,中國(guó)開(kāi)源模型和世界頂尖閉源模型的代際差距,我認(rèn)為還有3年;但到了今天,這個(gè)差距只有數(shù)月。”

這無(wú)疑是一句令人熱血沸騰的話(huà),意味著中國(guó)開(kāi)源模型與頂尖閉源的差距在不斷縮小,且性?xún)r(jià)比在不斷提升。此次MiMo-V2-Flash的 150 tokens/秒的推理速度,每百萬(wàn) token 輸入 0.1 美元、輸出 0.3 美元的成本,也讓我們目睹了中國(guó)開(kāi)源模型能把性?xún)r(jià)比壓榨到多么極致的地步。

在最新的羅永浩播客中,MiniMax 創(chuàng)始人閆俊杰也公開(kāi)表示:現(xiàn)在中國(guó)開(kāi)源模型的研發(fā)成本只有世界頂尖模型的1/10,但性能差距僅不到5%。

小米的野心不止于“人車(chē)家”。羅福莉在社交媒體上披露了更多信息:MiMo-V2-Flash的發(fā)布只是小米AGI路線圖的第二步。這背后暗示了小米在AI賽道上全面發(fā)力的決心。

屬于開(kāi)源模型的「小米時(shí)刻」,要來(lái)了。

MiMo-V2-Flash模型:https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash

技術(shù)報(bào)告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

AI Studio 體驗(yàn)地址:http://aistudio.xiaomimimo.com

責(zé)任編輯:武曉燕 來(lái)源: 51CTO技術(shù)棧
相關(guān)推薦

2024-12-23 12:33:42

2025-02-19 13:33:16

2025-04-09 04:22:00

2025-12-02 09:18:51

2024-12-30 20:32:36

2025-04-30 16:48:07

2023-03-15 10:26:00

模型開(kāi)源

2025-11-06 09:03:00

2025-08-19 21:23:45

DeepSeekAPP接口

2025-12-03 00:05:00

2025-12-04 14:35:32

Mistral 3AI 巨頭Apache 2.0

2025-08-20 09:08:00

2025-08-12 09:08:00

2021-02-05 15:35:21

Redis數(shù)據(jù)庫(kù)命令

2025-02-20 09:27:46

2025-04-10 09:15:00

模型AI數(shù)據(jù)

2024-12-04 13:34:22

2025-02-24 11:31:33

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

免费在线观看污视频| 免费在线黄色网址| 国产精品久久久乱弄| 精品三级在线观看| 中文在线中文字幕| 久久久三级国产网站| 亚洲欧洲在线一区| 尹人成人综合网| 国产成人精品综合久久久| 国产黄色精品| av日韩在线免费观看| 精品国产乱码久久久久久天美| 99在线精品免费视频 | 精品国产一区久久久| 精品51国产黑色丝袜高跟鞋| 亚洲成人免费视频| 中文在线天堂网| 亚洲美女屁股眼交| 成人丁香基地| 一区二区日韩电影| www午夜视频| 综合电影一区二区三区 | 欧美亚洲成人网| 欧美午夜18电影| 国产精品第一第二| 老汉色老汉首页av亚洲| 91国内揄拍国内精品对白| 亚洲欧美视频二区| 亚洲九九爱视频| 先锋影音欧美性受| 91精品国产一区二区三区| 99精品在免费线偷拍| 欧美国产日韩一区| 日韩在线不卡| 精品欧美国产一区二区三区不卡| 三级在线观看一区二区 | 久久综合999| 日本黄在线观看| 亚洲欧美一区二区三区在线 | 久久人人看视频| 国产伦精品一区二区三区视频| 高清国产在线一区| 懂色一区二区三区免费观看| 日本wwwwww| 在线成人高清不卡| 日韩色性视频| 国产传媒一区| 成人h动漫精品一区二区| 一级片免费看| 亚洲视频在线视频| 欧美69wwwcom| 九色在线视频观看| 欧美无乱码久久久免费午夜一区| 久久日本片精品aaaaa国产| 91中文字幕在线| 成人精品国产一区二区4080| 成人xxxx| 久久夜色精品国产| 9国产精品视频| 最新av中文字幕| 日韩资源在线观看| aⅴ色国产欧美| 波多野结衣在线| 中文字幕在线看视频国产欧美在线看完整| 第四色成人网| 人妻久久久一区二区三区| 亚洲成av人片观看| 欧美一区一区| 亚洲精品高清视频| 欧美r级在线观看| 亚洲高清不卡| 天堂中文资源在线| 国产精品久久久久久久美男| 中国av一区二区三区| 成人精品国产| 农民人伦一区二区三区| 亚洲人成电影网站色| 久久综合综合久久综合| aa级大片免费在线观看| 欧美日韩成人一区二区三区| 欧美视频精品在线| 久久精品在线| 伊人久久国产| 国产在线观看福利| 久草在线国产| 美国一区二区三区在线播放 | 精品99一区二区| 亚洲图片你懂的| 国产成人av电影免费在线观看| 在线看片成人| 不卡一区2区| 欧美激情在线精品一区二区三区| 国产极品一区| 另类激情视频| www.综合网.com| 在线中文资源天堂| 中文视频在线| 男人天堂午夜在线| 国产精品秘入口18禁麻豆免会员 | 国产91综合一区在线观看| 亚洲另类av| 亚洲成人1区| 福利影院在线看| 久操av在线| 在线中文字幕播放| 蜜芽在线免费观看| 美丽的姑娘在线观看免费动漫| 亚洲少妇久久久| 国产女女做受ⅹxx高潮| 久久精品一区二| 夫妻免费无码v看片| 日韩中文一区二区三区| 久久久精品亚洲| 亚洲国产日韩欧美综合久久| 欧美视频日韩视频| 日本道在线观看一区二区| 免费看欧美美女黄的网站| 91精品久久久久久| 国产99视频精品免视看7| 久久亚洲电影| 天天躁日日躁狠狠躁欧美巨大小说| 依依成人在线| 欧美亚洲国产精品| 亚洲国产精品自拍| 国产成人av在线影院| 精品一区二区三区免费播放| 久久精品欧美一区| 亚洲天堂av综合网| 色婷婷综合在线| 91精品国产91久久久久久密臀| 欧美a级一区| 亚洲网色网站| 99国产精品一区二区| 91精品一区二区三区综合在线爱| av电影在线观看一区二区三区| 久久国产精品网| 图片区小说区区亚洲五月| 日日夜夜精品网站| 久久久久久久久久网| 欧美 国产 精品| 成人av番号网| 亚洲一区二区三区在线视频| 91性高湖久久久久久久久_久久99| 91精品国产综合久久久久久蜜臀| 国产专区精品视频| 国产精品三区在线| 亚洲精品不卡| 免费看黄在线看| 亚洲一区三区视频在线观看| 国产一区二区三区四区五区加勒比| 日本sm极度另类视频| 美女视频久久| 国产精品日韩二区| av 日韩 人妻 黑人 综合 无码| 国产乱人伦精品一区二区三区| 亚洲成人男人天堂| 99中文字幕| 牛牛影视久久网| 美乳在线观看| 97伦理在线四区| 欧美在线视频你懂得| 亚洲激情综合| 在线免费看h| 日日噜噜噜噜久久久精品毛片| 国产精品1234| 欧美视频在线一区| 国产一区二区在线免费观看| 欧洲大片精品免费永久看nba| igao视频网在线视频| 欧美综合激情| 久久九九国产精品怡红院 | 国产精品国产馆在线真实露脸| 国产欧美日韩| 色在线视频网| 一区二区三区免费播放| 亚洲自拍偷拍区| 国产亚洲欧美aaaa| 五月激情综合网| 国产一区二区三区四区在线观看| av综合网页| 成人高清免费在线| 久热免费在线观看| 国产欧美日韩在线播放| www.午夜精品| 欧美日韩精品高清| 日本一区二区在线不卡| 国产精品五区| 国产精品传媒| 精品一性一色一乱农村| 国产精品影视| 亚洲最大免费| 成人www视频在线观看| 亚洲系列中文字幕| 日韩欧美国产黄色| 久久网站热最新地址| 欧美一级久久| 欧美日韩老妇| 91麻豆精品一二三区在线 | 狠狠色狠狠色综合日日五| 成人国产在线观看|