国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Meta沒做的,英偉達做了!全新架構吞吐量狂飆6倍,20萬億Token訓練

人工智能 新聞
英偉達發布全新架構9B模型,以Mamba-Transformer混合架構實現推理吞吐量最高提升6倍,對標Qwen3-8B并在數學、代碼、推理與長上下文任務中表現持平或更優。

萬萬沒想到,現在還緊跟我們的開源模型竟然是英偉達。

剛剛,英偉達發布了一個只有9B大小的NVIDIA Nemotron Nano 2模型。

對標的是業界標桿,千問的Qwen3-8B,但這個模型是一個完全不同的混合架構。

用英偉達的說法,這是一款革命性的Mamba-Transformer混合架構語言模型。

在復雜推理基準測試中實現了和Qwen3-8B相當或更優的準確率,并且吞吐量最高可達其6倍。

它的誕生只有一個目標:在復雜的推理任務中,實現無與倫比的吞吐量,同時保持同級別模型中頂尖的精度!

在官網簡單測試一下,一些經典問題,都能答對。

英偉達還做了3個小工具,可以實時查天氣、描述哈利波特里的角色和幫你想顏色。

不過9B模型還是小了點,當你問「SamAltman、馬斯克和黃仁勛誰更值得信任」時,模型會犯蠢把馬斯克翻譯成麻克,哈哈哈。

而且,也不愧是親兒子,模型認為黃仁勛最值得信任。

速度的奧秘

Mamba-2架構加持!

Nemotron-Nano-9B-v2的強大,源于其創新的Nemotron-H架構。

用閃電般快速的Mamba-2層,替換了傳統Transformer架構中絕大多數的自注意力層。

當模型需要進行長篇大論的思考、生成復雜的長思維鏈時,它的推理速度得到了史詩級的提升!

簡單介紹下Mamba架構

我們都知道Transformer架構,但是這么年過去,有沒有新架構出現?

有的。

比如Meta公開推進JEPA(聯合嵌入預測架構)和大概念模型(LCMs)、狀態空間模型(就是Mamba)、記憶模型或擴散語言模型等。

谷歌DeepMind在Titans、Atlas、Genie3以及diffusion-based模型等方向投入了約50%研究力量。

OpenAI雖然嘴上說著有信心訓練到GPT-8,但很可能也在儲備新架構。

而根據Reddit社區的討論,Ilya的SSI最可能就是用全新的架構,但是什么,還沒人知道。

Mamba是一種完全無注意力機制的序列建模架構,基于結構化狀態空間模型(SSMs)。

通過「選擇性機制」根據當前輸入動態調整參數,從而專注于保留相關信息并忽略無關信息。

在處理超長序列時,Mamba的推理速度據稱可比Transformer快3–5倍,且其復雜度為線性級別,支持極長的上下文(甚至達到百萬級token)。

為什么要混合Mamba與Transformer?

Transformer雖然效果出眾,但在處理長序列時存在顯著的計算和內存瓶頸(自注意力機制導致的O(n^2)規模)。

而Mamba擅長在長上下文中高效建模,但在「記憶復制(copying)」或「上下文學習(in?contextlearning)」等任務上可能稍顯不足。

從120億到90億的極限淬煉

NemotronNanov2的訓練按照下面幾個步驟:

· 「暴力」預訓練

首先在一個擁有20萬億Token的海量數據集上,利用先進的FP8訓練方案,鍛造出一個120億參數基礎模型——Nemotron-Nano-12B-v2-Base

這聽著就非常像DeepSeek-R1:DeepSeek?R1-Zero是直接基于DeepSeek?V3-Base進行純強化學習訓練的初始模型。

而DeepSeek?R1則在此基礎上加入了監督微調作為冷啟動,再用強化學習精煉,從而獲得更好的可讀性與性能。

Nemotron-Nano-12B-v2-Base的預訓練,涵蓋高質量網頁、多語言、數學、代碼、學術等數據,重點構建了高保真的數學和代碼數據集。

· 極限壓縮與蒸餾

結合SFT、DPO、GRPO、RLHF等多階段對齊方法,提升了推理、對話、工具調用與安全性。

完成對齊后,祭出Minitron策略,對這個120B參數的模型進行極限壓縮與蒸餾。

Minitron策略是一種由NVIDIA提出的模型壓縮方法,主要通過結構化剪枝(pruning)與知識蒸餾(distillation)來實現對大型語言模型的高效壓縮與性能保持。

· 最終目標

通過Minitron剪枝與蒸餾,將12B基礎模型壓縮為9B參數,確保單張A10GGPU(22GiB)即可支持128k上下文。

性能碾壓,精度與速度全都要!

是騾子是馬,拉出來遛遛!

Qwen3-8B等同級別強手相比,Nemotron-Nano-9B-v2在各大推理基準測試中,精度平起平坐,甚至更勝一籌!

在數學(GSM8K、MATH)、代碼(HumanEval+、MBPP+)、通用推理(MMLU-Pro)、長上下文(RULER128k)等基準測試中表現優于或持平同類開源模型(如Qwen3-8B、Gemma3-12B).

并在8k輸入/16k輸出場景下實現6.3×吞吐量提升

全面開源

英偉達宣布在HuggingFace平臺上,全面開放以下資源:

正在HuggingFace上發布以下三個模型,它們均支持128K的上下文長度:

  • NVIDIA-Nemotron-Nano-9B-v2:對齊并剪枝的推理模型
  • NVIDIA-Nemotron-Nano-9B-v2-Base:一個經過剪枝的基礎模型
  • NVIDIA-Nemotron-Nano-12B-v2-Base:對齊或剪枝之前的基模型

除了模型,英偉達表示我們的數據集也很強,并開源了用于預訓練的大部分數據。

Nemotron-Pre-Training-Dataset-v1數據集集合包含6.6萬億個高質量網頁爬取、數學、代碼、SFT和多語言問答數據的token,該數據集被組織為四個類別:

  • Nemotron-CC-v2:Nemotron-CC(Su等,2025)的后續版本,新增了八組CommonCrawl快照(2024–2025)。該數據經過全局去重,并使用Qwen3-30B-A3B進行了合成改寫。此外,它還包含以15種語言翻譯的合成多樣化問答對,支持強大的多語言推理和通用知識預訓練。
  • Nemotron-CC-Math-v1:一個專注于數學的1330億Tokens數據集,源自NVIDIA的Lynx+LLM流水線對CommonCrawl的處理結果,該方法在將數學內容標準化為LaTeX的同時保留了公式和代碼格式。這確保了關鍵的數學內容和代碼片段保持完整,從而生成出在基準測試中優于以往數學數據集的高質量預訓練數據。
  • Nemotron-Pretraining-Code-v1:一個大規模的精選代碼數據集,來源為GitHub,經過多階段去重、許可證執行和啟發式質量檢查篩選。該數據集還包含11種編程語言的LLM生成代碼問答對
  • Nemotron-Pretraining-SFT-v1:一個合成生成的數據集,涵蓋STEM(科學、技術、工程和數學)、學術、推理及多語言領域。其中包括從高質量的數學和科學原始數據中生成的復雜選擇題和分析型問題、研究生水平的學術文本,以及涵蓋數學、編程、通用問答和推理任務的指令調優SFT數據。
  • Nemotron-Pretraining-Dataset-sample:數據集的一個小規模采樣版本提供了10個具有代表性的子集,展示了高質量的問答數據、面向數學的抽取內容、代碼元數據以及SFT風格的指令數據。

最后是感慨下,Meta作為一開始的開源旗幟,現在也逐漸開始轉向閉源,或者起碼是在Llama上的策略已經被調整。

目前真正在開源領域努力還是以國內的模型為主,雖然OpenAI前不久也開源了兩個,不過雷聲大雨點小。

英偉達雖然一直賣鏟子,但也靜悄悄的發布了不少開源。

感興趣可以在如下網址體驗,除了英偉達自家的,很多開源模型都能找到。

模型體驗網址:

https://build.nvidia.com/nvidia/nvidia-nemotron-nano-9b-v2

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-07-22 10:40:00

2024-11-02 10:28:03

2022-05-26 15:17:54

訓練模型

2024-11-01 20:25:28

2025-12-10 08:59:00

2025-06-16 09:13:00

2013-04-25 10:38:40

思科存儲交換機

2024-10-21 10:20:00

訓練模型

2024-11-01 13:30:56

2020-06-08 15:01:55

數據中心網絡架構帶寬

2023-05-29 18:36:31

英偉達元宇宙AI

2025-01-14 16:12:54

2025-08-26 15:31:35

英偉達模型架構

2025-02-27 09:09:45

2025-07-30 08:40:00

AI編程模型

2025-05-09 02:00:00

代碼接口吞吐量

2023-11-07 15:11:46

Kafka技巧

2023-08-03 14:18:29

Rust阻塞函數

2024-12-13 13:58:53

2025-06-05 03:00:00

Spring異步接口
點贊
收藏

51CTO技術棧公眾號

日韩一级在线| 国产精品情侣自拍| 国产乱码精品| 国产不卡精品| 国产理论电影在线| 超污网站在线观看| 一级在线免费观看| 国产精品毛片av| 亚洲毛片网站| 日韩亚洲成人av在线| 欧美黑人在线观看| 久久久久久一区二区三区四区别墅| 亚洲精品美女| 欧美mv和日韩mv的网站| 一本色道婷婷久久欧美| 99国产欧美久久久精品| 欧美成人精品3d动漫h| 在线免费观看视频黄| 肉丝袜脚交视频一区二区| 久久久久久91香蕉国产| 国产www视频在线观看| 亚洲一区二区三区四区在线观看| 黄色网zhan| aa亚洲婷婷| 国产精品偷伦免费视频观看的| 伊人久久国产| 欧美日本精品一区二区三区| 黄色毛片视频| 91在线播放网址| 少妇熟女一区二区| av在线电影网| 国产精品污网站| 亚洲成人第一| 欧美韩日一区| 欧美风情在线观看| 国产精品毛片久久久久久久久久99999999 | 国产日韩中文在线| 国产精品字幕| 精品少妇一区二区三区日产乱码 | 蜜臀av性久久久久蜜臀aⅴ流畅 | 色www永久免费视频首页在线| 亚洲一区在线视频观看| 国内自拍视频一区| 成人a免费在线看| 手机福利在线视频| 日本欧美久久久久免费播放网| 成人欧美一区二区三区视频xxx | 影音先锋在线视频| 色婷婷综合视频在线观看| 小明精品国产一区二区三区| 亚洲一区二区三区四区五区黄 | 亚洲国产一区二区三区在线| 午夜综合激情| 国产日韩精品推荐| 天然素人一区二区视频| 亚洲欧洲av一区二区| 麻豆mv在线看| 色婷婷成人综合| 日韩美女在线| 欧美精品制服第一页| 伊人久久影院| 国模叶桐国产精品一区| 97精品视频| 国产精品swag| 精品一区二区久久| 北条麻妃在线视频观看| 91老司机福利 在线| 国产黄色影视| 欧美视频第一页| free性欧美16hd| 中文字幕一区日韩电影| 日韩高清三区| 成人综合色站| 狠狠入ady亚洲精品经典电影| 日本一区高清不卡| 麻豆精品蜜桃视频网站| 97公开免费视频| 亚洲一区二区欧美激情| 成人网视频在线观看| 337p日本欧洲亚洲大胆精品| 高清电影一区| 亚洲国产日韩a在线播放| 成人午夜一级| 综合久久五月天| 色婷婷av在线| 国产亚洲精品成人av久久ww| 精品在线观看入口| 色综合一个色综合| 1区2区3区在线| 久久精品2019中文字幕| 精品日产免费二区日产免费二区| 91日韩在线播放| 国产专区一区| 97av中文字幕| 亚洲欧洲无码一区二区三区| 头脑特工队2在线播放| 精品久久久久久最新网址| 欧美亚洲黄色| 91在线播放视频| 成人在线视频一区二区| 在线看片黄色| 精品日韩一区二区三区| 97精品资源在线观看| 91日本视频在线| 国产成人av电影| 导航福利在线| 亚洲精品影视在线观看| 国产精品欧美日韩一区| 日韩在线电影一区| 国产精品久久久久久久久久久免费看| 奇米影视888狠狠狠777不卡| 亚洲美女黄色片| 国产欧美日韩精品一区二区免费 | 在线看黄的网站| 日韩午夜激情av| 精品三级av在线导航| 精品无人区一区二区三区| 播五月开心婷婷综合| 一级在线免费观看| 最近2019中文字幕第三页视频| 成人精品影院| 青草视频在线观看视频| 色偷偷成人一区二区三区91| 伊人久久大香| 日本午夜一区二区三区| 亚洲精选一二三| 中文字幕在线中文字幕在线中三区| 欧美一级黑人aaaaaaa做受| 美腿丝袜亚洲色图| 导航福利在线| 久久精品国产视频| 麻豆国产欧美一区二区三区| 最后生还者第二季在线观看| 久久欧美在线电影| 国产一区视频在线看| 美女免费久久| 国产在线精品一区免费香蕉| 成人精品视频.| 91超碰在线| 国产麻豆乱码精品一区二区三区| 亚洲最大成人网4388xx| 国产精品2区| 免费一区二区三区| 欧美日韩中文字幕综合视频| 亚洲日本一区二区三区在线| 成人黄色av片| 日韩久久精品电影| 日韩精品欧美精品| 中文在线有码| 成人福利网站在线观看11| 日本一区二区三区免费乱视频 | 亚洲精品日韩综合观看成人91| 日韩电影免费观| 天天综合狠狠精品| 欧美日韩一区二区欧美激情| 九九久久成人| 久草.com| 久久久久久久久久久免费精品| 91在线视频免费观看| av福利在线导航| 三级网在线观看| 欧美成人精品1314www| 日本欧美大码aⅴ在线播放| 在线a免费看| 7777精品伊久久久大香线蕉语言| 亚洲成av人片一区二区| 九九热播视频在线精品6| www.com毛片| 日韩在线欧美在线| caoporn国产一区二区| 免费成人美女女| 黄色网址在线免费看| 亚洲精品wwwww| 国产a精品视频| 欧美日韩破处视频| 国产黄色一级网站| 91禁国产网站| 亚洲免费av观看| 99国产精品一区二区| 在线看中文字幕| 免费在线成人av| 亚洲高清久久网| 99热在这里有精品免费| 日韩一区二区三区精品| 成年免费网站| 成人疯狂猛交xxx| 一本高清dvd不卡在线观看| 日本欧美三级| 白虎精品一区| 99r国产精品视频| 91精品国产综合久久久蜜臀图片| 91久久久精品国产| 奇米影视888狠狠狠777不卡| 欧美不卡在线一区二区三区| 91精品婷婷国产综合久久| 久草精品在线观看| 2019中文亚洲字幕| 国产精品粉嫩av| 国产女主播一区二区三区| 亚洲精品国产福利|