国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

倒反天罡!Gemini Flash表現超越Pro,“帕累托前沿已經反轉了”

人工智能 新聞
Gemini 3 Flash的表現在SWE-Bench Verified測試中獲得了78%的分數,比超大杯Pro還略勝一籌。

倒反天罡!

Gemini 3 Flash的表現在SWE-Bench Verified測試中獲得了78%的分數,比超大杯Pro還略勝一籌。

而且Flash的速度和性價比,都是Pro版難以望其項背的。

谷歌解釋,這是因為Flash版當中的一些優化技術,還未在Pro里應用。

但用網友的話講,Flash這樣的表現的確提醒我們帕累托前沿已經反轉,是時候拋卻“旗艦版迷信”了。

Flash表現超越Pro

根據谷歌團隊最新披露的詳細評測數據,Gemini 3 Flash這一次不僅在智能程度上全面超越了上一代的Gemini 2.5 Pro,還在編程能力和多模態推理等核心性能維度上,直接反超了自家的旗艦Gemini 3 Pro以及競品GPT-5.2。

在衡量軟件工程能力的權威測試SWE-Bench Verified 中,Flash 一舉斬獲了 78% 的高分。這一成績不僅在智能程度上全面碾壓了上一代的Gemini 2.5 Pro,還反超了自家旗艦Gemini 3 Pro的76.2%。

在AIME 2025數學競賽基準測試中,結合代碼執行能力的Flash得分高達 99.7%,已無限逼近100%的滿分大關。

即便是在難度極高、被設計用來難倒現代大模型的Humanity’s Last Exam測試中,Flash的表現也緊追旗艦,在不使用工具的情況下獲得了33.7%的分數,與Pro版37.5%的成績已經處于同一梯隊。

除了硬核的智能指標,Flash的響應速度與成本也極具優勢。

數據表明,Gemini 3 Flash的推理速度是2.5 Pro的3倍,Token消耗量減少30%,價格也極具競爭力,輸入端僅需0.50美元每100萬Token,輸出端為3美元每100萬Token。

雖然略貴于Gemini 2.5 Flash(每百萬輸入0.3美元/每百萬輸出2.5美元),但考慮到其性能和速度,這一價格仍然相當具有吸引力。

如果輕量版已經如此強大,甚至在關鍵指標上實現了反超,那么“超大杯”存在的意義究竟是什么?

對于這個問題,谷歌核心團隊給出了一個意料之外的答案——這并非研發事故,而恰恰是他們頂層設計中最為關鍵的一環。

“Pro的作用就是蒸餾Flash”

就在前幾天,Gemini的三位負責人——DeepMind研究副總裁Oriol Vinyals、谷歌首席科學家Jeff Dean和Noam Shazeer,以及Google AI Studio產品負責人Logan Kilpatrick同臺,正式揭示了這背后的戰略邏輯。

在談及旗艦模型的定位時,Oriol Vinyals拋出了極為犀利的觀點,他直言Pro模型的主要作用其實就是拿來“蒸餾Flash。

團隊認為Flash這樣“小而強”的模型對用戶至關重要,隨著迭代,新一代Flash往往能達到甚至超過上一代Pro的水平。

在理想狀態下,Pro的目標是不計成本地探索智能上限,而Flash則通過蒸餾技術繼承Pro的能力,并極致優化延遲、成本和吞吐量,未來Pro甚至可能主要作為一個“生成器”,專門用來生產高質量的Flash模型。

但這并不意味著主宰AI發展多年的Scaling Law已經失效。

面對Flash這種“以小博大”的表現,外界很容易產生一種錯覺,認為大模型走到頭了。

然而在對話中,Vinyals旗幟鮮明地反駁了這一點,他明確表示,與目前流行的“Scaling 結束論”相反,Gemini 團隊通過持續擴大規模實現了巨大的性能飛躍,在他看來,前方依然“看不到墻”(No walls in sight)。

Scaling Law雖未消亡,但也確實在發生演變。

Noam認為單純靠預訓練階段堆砌參數來換取智能增長的路徑確實正在逼近極限,“規模神話”不再是唯一的真理,未來的擴展重點將從預訓練階段的算力堆疊,轉移到推理側的擴展(Test-time Compute)。

對于未來的演進,三位負責人一致認為后訓練(Post-training)是目前最大的“未開墾綠地”。

雖然代碼、推理和數學等基準測試已被逐漸“擊穿”,但在諸如“規劃舊金山旅行”這類開放式任務上,通過后訓練提升的空間依然巨大。

參數不再是迷信

Flash帶來的沖擊波正在引發一場關于“參數至上論”的大討論。

開發者們驚訝地發現,那個一直以來被視為鐵律的“帕累托前沿”竟然發生了倒轉——更便宜、更快的模型,現在竟然也是更聰明的模型。

這直接打破了“模型越大越好”的迷信。

針對Flash為何能反殺Pro,Google DeepMind的研究員Ankesh Anand揭示了背后的技術真相——答案在于強化學習。

他明確指出,Flash不僅僅是Pro的簡單蒸餾版,它還集成了大量最新的Agentic RL(代理強化學習)研究成果。

這一結果證明了一個核心命題:在提升模型能力的道路上,單純堆砌參數并不是唯一的路徑。

通過更先進的后訓練算法(如RL),小模型完全可以實現“降維打擊”,在軟件工程等關鍵領域戰勝參數量巨大的旗艦模型。

正如開發者所言,現在是時候停止對“旗艦版”的盲目崇拜了。

責任編輯:張燕妮 來源: 量子位
相關推薦

2009-05-11 14:58:06

帕累托資產管理摩卡軟件

2019-09-09 15:28:04

數據科學帕累托法則工具

2023-01-19 08:00:00

2020-11-08 14:13:31

Python帕累托分析開發

2025-07-16 09:52:07

2021-12-06 10:14:25

設計師UX設計帕累托原則

2025-04-21 09:15:00

2025-12-21 15:36:22

2025-05-17 08:39:52

2025-12-18 10:12:39

Gemini3FlashPro

2025-04-10 06:16:33

2025-06-17 08:40:44

2025-02-06 12:10:00

2025-02-06 09:28:00

2019-11-13 14:16:09

Python開發工具

2017-03-24 15:20:28

人工智能機器學習AI算法

2024-12-20 14:30:00

2025-02-14 08:00:00

人工智能Gemini 2.0LLM

2024-08-02 14:58:00

2025-02-06 13:13:07

點贊
收藏

51CTO技術棧公眾號

国产精品中文字幕在线观看| 欧美激情777| 在线成人动漫| 日韩大尺度在线观看| 韩日av一区二区| 中文精品99久久国产香蕉| 国产伦精品一区二区三区免费视频| 免费成人进口网站| 91欧美极品| 国产三区在线成人av| 久久精品国产v日韩v亚洲| 香港日本韩国三级| 久久精品成人| 在线观看欧美日韩| av在线app| 国产一区二区影视| 久久影视电视剧免费网站| 国产精品无码av在线播放| 亚洲丝袜啪啪| 欧美一级欧美一级在线播放| 日韩中文字幕三区| 欧美日韩有码| 日韩一区二区三区三四区视频在线观看| 亚洲熟妇国产熟妇肥婆| 国产精品115| 国产精品网曝门| 亚洲激情久久久| 久久久五月天| 日韩大片免费观看视频播放| 自拍视频在线网| 国产精品一区二区在线观看网站 | 91精品国产麻豆| 大西瓜av在线| 日韩一区二区中文| 尤物九九久久国产精品的特点 | 欧美国产视频| 欧美电影免费提供在线观看| 91老司机福利在线| 欧美精品日日鲁夜夜添| 久久精品综合| 久久久精品黄色| 亚洲欧洲国产专区| 97av在线影院| 日av在线播放| 国产成人综合在线观看| 久久久久在线观看| 日韩免费小视频| 色综合男人天堂| 领导边摸边吃奶边做爽在线观看 | 最近2019中文免费高清视频观看www99| 成人综合网址| 欧美性猛交xxxx偷拍洗澡| av大全在线免费看| 欧美色综合网站| 91caoporn在线| 奇米777四色影视在线看| 欧美一区精品| 特黄特色欧美大片| 欧美日韩综合精品| 中文字幕一区三区| 成人禁在线观看网站| 日韩中文字幕高清在线观看| 欧美国产视频日韩| 欧美日韩播放| 久久99影院| 国产麻豆午夜三级精品| 警花观音坐莲激情销魂小说| 国产精品欧美一区喷水| 性色视频在线| 亚洲精品美女在线| 要久久爱电视剧全集完整观看 | avtt天堂资源网| 精品av综合导航| 亚洲bt欧美bt精品777| 日本免费a视频| 亚洲欧洲在线播放| 玖玖在线免费视频| 国产一区二区三区在线观看精品 | 免费a级在线播放| 亚洲一区二区在线视频| 成人高潮成人免费观看| 亚洲国产精品视频在线观看| 国产精品毛片久久久久久久久久99999999| 亚洲第一国产精品| 久色视频在线| 欧美激情一区二区三区全黄 | 国产嫩草一区二区三区在线观看| 日韩www.| 国产九色porny| aaa亚洲精品一二三区| 黄页网站在线观看| 日韩经典中文字幕| 国产一区二区三区网| 欧美另类视频在线| 国产精品免费视频观看| 嫩草香蕉在线91一二三区| 在线区一区二视频| 一区在线视频观看| 91精品短视频| 欧美国产一二三区| 欧美日韩亚洲高清| 91午夜精品| 中文字幕在线观看不卡视频| 亚洲综合资源| jizzzz日本| 日韩在线观看电影完整版高清免费| 亚洲精品日韩一| 成人免费影院| 国产伦精品一区二区三区免| 亚洲天堂成人网| 日本成人精品| 午夜电影一区二区三区| 亚洲色图欧洲色图婷婷| 欧美体内she精视频在线观看| 九九久久九九久久| 国产精品一区而去| 亚洲在线一区二区| 国产精品网站在线观看| 91九色porn在线资源| 国产999精品| 国产精品国产三级国产| 韩国理伦片久久电影网| 久久精品日产第一区二区三区精品版 | 韩国精品美女www爽爽爽视频| 国产伦精品一区二区三区视频青涩| 国内精彩免费自拍视频在线观看网址| 欧美成人性色生活仑片| 国产成人精品亚洲777人妖| 亚洲成**性毛茸茸| 国产精品美女久久久久高潮| 欧美婷婷在线| 免费一级欧美在线观看视频| 992tv在线| 国产呦系列欧美呦日韩呦| 日韩视频在线你懂得| 成人亚洲免费| av高清日电影| 亚洲成人在线视频网站| 精品少妇v888av| 色综合久久中文字幕| 国产一区二区三区在线观看免费视频| 国产成人亚洲一区二区三区| 欧美老女人性生活| 亚洲高清视频的网址| 亚洲精品1区| 日本成人a网站| yy6080久久伦理一区二区| 香蕉视频在线观看免费| 精品欧美日韩| www日韩欧美| 欧美日韩一区三区四区| 91色视频在线| 久久精品国产亚洲一区二区三区| 日本不卡高清| 91综合久久爱com| 日韩在线网址| a中文在线播放| 国产精品青青在线观看爽香蕉| 综合久久久久久| 噜噜噜91成人网| aiss精品大尺度系列| 国内在线精品| 激情视频免费网站| 欧美一区激情视频在线观看| 欧美亚洲国产成人精品| 亚洲欧美在线播放| 欧美日本国产视频| 国产精品二三区| 成人av网址在线| a美女胸又www黄视频久久| 久久字幕精品一区| 97久久超碰国产精品电影| 成人羞羞网站入口| 韩国精品福利一区二区三区| 色婷婷热久久| 国产精品稀缺呦系列在线| 国产福利在线免费观看| 亚洲综合色在线观看| 欧美一区二区三区四区在线观看地址 | 欧美日韩一区在线观看| 夜夜嗨av一区二区三区网页 | 国产系列电影在线播放网址| 国产精品久久久久影院日本| 国产精品电影一区| 午夜精品www| 国产精品日韩在线| 精品毛片久久久久久| 精品国产乱码久久久久软件| 国产精品一区二区欧美| 能看的毛片网站| 人妻无码久久一区二区三区免费| 久久激情视频久久| 国内高清免费在线视频| 欧美性爽视频| 啊啊啊久久久| 91在线亚洲| youjizzjizz亚洲| 欧美日韩一本| 激情图片小说一区| 六月丁香综合在线视频|