国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

谷歌大模型“性價比之王”來了!混合推理模型,思考深度可自由控制,競技場排名僅次于自家Pro

人工智能 新聞
作為更注重效率的Flash,在大模型競技場上排名并列第二,第一是自家的Gemini 2.5 Pro。

緊跟o4-mini,谷歌上新了Gemini 2.5 Flash preview版本。

作為更注重效率的Flash,在大模型競技場上排名并列第二,第一是自家的Gemini 2.5 Pro。

這樣的表現,讓Gemini 2.5 Flash的性價比直接拉滿。

而且還是一款混合推理模型,可以自由設定思考深度,幫助預算不足的用戶進一步控制推理成本。

目前,preview版本(不同于Gemini網頁版中的版本)已在Google AI Studio和Vertex AI的 API中上線。

圖片

主打性價比,思考深度自由調控

在大模型競技場上,經過3000多輪對戰,Gemini 2.5 Flash獲得了1392分的成績,與Grok-3、GPT-4.5等模型并列第二。

綜合成績僅次于自家的Pro版,這樣看來在競技場中戰勝谷歌的只有谷歌了。圖片

圖片

并且在編程、復雜提示和長文本三個子榜單中,都和Pro版并列第一。

圖片

在大模型競技場推出的WebDev榜單里,Gemini 2.5 Flash位列第七,超過了前一代(2.0)的Pro版本。

圖片

此外谷歌還展示了Gemini 2.5 Flash在一系列高難度數據集上的表現。

其中包括由1000多名學者提出的“人類最后的考試”,這套測試集發布時沒有任何一個模型得分超過10%,現在Gemini 2.5 Flash的成績是12.1%。

圖片

作為Flash版本,Gemini 2.5 Flash在谷歌自家的模型中,是至今性價比最高的版本。

其價格為0.15/0.6/3.5美元每百萬輸入/輸出/推理Token,和o4-mini相比便宜了不少。

圖片

實際上,如果按照輸入輸出3:1的比例計算,在大模型競技場1400分附近,Gemini 2.5 Flash是最便宜的一款模型。

圖片
△請注意橫軸數字非單調下降

另外對于價格相對較高的推理過程,Gemini 2.5 Flash支持自由深度控制(甚至完全關閉),可以幫助預算不足的用戶節約成本。

如果不進行設置,模型也會根據prompt自己判斷適宜的思考深度,避免在簡單的問題上過度思考,從而平衡成本。

圖片

o4-mini的競爭者?

在HackerNews上,Gemini 2.5 Flash引發了熱烈的討論。

有人認為,谷歌不搞炒作,但實際上性價比非常高,谷歌正在贏得人工智能競賽。

也有人覺得,便宜是便宜,但是模型有時候會犯懶,不過這也在預料之中。

當然,實際應用還是要看具體任務,不過可以確定的是,Gemini 2.5 Flash的性價比已經獲得了部分人的認可。

圖片

另外由于Gemini的Flash版本和OpenAI的mini類似,再加上上線時間鄰近,Gemini 2.5 Flash也被視為o4-mini的競爭者。

不過從谷歌官方發布的成績單上看,Gemini 2.5 Flash在一些難度較高的測試集中,表現是要稍遜于o4-mini的。

但如果考慮價格,這樣的差距似乎可以接受,而且實際任務當中,也不總是需要模型能夠應付這些最難的問題。

圖片

那么,在實際環境當中,Gemini 2.5 Flash的表現又如何呢?首先看看編程能力。

先安排一下著名的小球測試變體——一個大五邊形中包含了三個缺一邊的小五邊形,之間互不交叉,小球在其中按照物理規律運動。

五邊形的部分Gemini 2.5 Flash,正確繪制出來了,但對于小球則是完全已讀亂回,經過了反復調整之后依然翻車。

圖片

再看o4-mini,運行結果符合提示詞要求,并且代碼更加精簡,僅128行,而Gemini版本超過了500行。

這一輪,o4-mini勝。

圖片

再看數據分析能力。

我們找來了最近某班次航班的飛行記錄,包含了起飛到降落過程中各時間點的位置、高度、速度、航向等信息,一共有1700余個數據點。

給出的任務則是繪制出高度和速度隨時間變化的折線圖,并且涉及到了時區和計量單位的換算(原始數據中時間為UTC時間、高度為英尺、速度為節,需要換算成北京時間、高度單位為米、速度單位為公里每小時)。

雖然我們上傳了數據文件,但一開始Gemini沒有選擇外掛,而是把數據全都寫進了Python代碼,導致代碼非常冗長。

經過提示之后,Gemini對代碼進行了改進,得到了正確的圖像。

圖片

o4-mini這邊,雖然結果也對,但是沒有考慮清楚坐標軸文本的長度,導致橫軸上所有標簽都擠成一團。

而且相比之下,Gemini的版本還帶有網格線,能夠更清晰地看出各點對應的大致數值。

這一輪,Gemini勝。

圖片

最后一輪,來看下兩款模型的多模態理解能力。

這是英偉達最近一個月的股票形勢圖,我們讓兩款模型分別分析一下最佳的入手時機。

圖片

它們都從圖中正確發現了最低點和對應的時間,至于回答質量,還是直接看他們的輸出結果:

圖片

總的來說,如果不考慮價格,Gemini 2.5 Flash確實和o4-mini比還有些不盡如人意,但落地中考慮性價比,可能綜合競爭力就體現出來了。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-05-31 14:23:15

2025-03-13 06:34:49

2025-04-18 10:36:42

2025-02-14 11:18:57

2011-05-05 10:58:13

應用商店App StoreBlackBerry

2025-02-28 08:40:00

2025-11-13 08:00:00

大推理模型AI人工智能

2025-03-26 08:39:03

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-08-12 09:14:00

2025-04-02 09:21:00

DeepSeekAI開源

2012-05-31 14:20:14

2025-02-25 08:15:09

2024-06-20 14:04:17

2025-02-06 12:10:00

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-03-05 00:22:00

2025-10-10 01:25:00

大模型訓練數據OpenAI

2025-05-13 05:11:00

推理模型微調

2024-07-24 12:40:44

點贊
收藏

51CTO技術棧公眾號

亚洲成av人片一区二区| 亚洲国产欧美一区二区丝袜黑人 | 高清欧美性猛交xxxx黑人猛| 欧美午夜宅男影院在线观看| 日本精品久久久久久久久久| 久久久久美女| 欧美高清视频免费观看| 成全电影大全在线观看| 婷婷六月综合网| 日韩一级在线免费观看| 石原莉奈一区二区三区在线观看| 国产精品男人爽免费视频1| 欧美男男gaygay1069| 日韩免费看网站| 蜜桃视频在线观看网站| 中文字幕在线不卡一区二区三区| 欧美人与动牲交xxxxbbbb| 国产精品久久久久久久免费软件| 成人疯狂猛交xxx| 五月天亚洲一区| 欧美精品在线视频观看| 麻豆免费版在线观看| 欧美一区二区三区免费在线看 | 五月婷婷欧美视频| 蜜臀久久99精品久久久酒店新书 | 久久久久久久久久久免费视频| 蜜乳av一区二区三区| 俄罗斯精品一区二区| 国产成人ay| 午夜精品福利在线观看| www.久久草.com| 亚洲欧美综合区自拍另类| 精品黄色免费中文电影在线播放| 欧美性猛交xxxx久久久| 精产国产伦理一二三区| 亚洲欧洲成人精品av97| 艹b视频在线观看| 欧美国产日韩a欧美在线观看| 日本中文字幕网址| av不卡一区二区三区| www.av91| 91在线观看污| 一本岛在线视频| 91网站在线播放| 虎白女粉嫩尤物福利视频| 久久综合一区二区| 黑人粗进入欧美aaaaa| 亚洲国产精品av| 白浆爆出在线观看| 香蕉久久一区二区不卡无毒影院 | 91精品福利观看| 久久精品国产清自在天天线| 99精品女人在线观看免费视频| www.美女亚洲精品| 欧美日本三级| 欧美一级大片在线观看| 成人免费看片39| 成人欧美一区二区| 一本综合精品| 久久最新免费视频| 91啪九色porn原创视频在线观看| 国产一二三区av| 精品久久久久久久久久ntr影视| 爱久久·www| 亚洲精品国精品久久99热一| www.一区| 国产精品免费一区二区三区都可以| 欧美特黄一区| 国产精品免费看久久久无码| 国产精品久久久久国产精品日日| 四虎影院在线播放| 亚洲第一av在线| 成人黄色理论片| 国产成人精品久久| 99精品视频免费观看视频| 天堂8在线天堂资源bt| 亚洲精品国产无套在线观| 3p视频在线观看| 中文字幕日韩在线播放| 日本不卡电影| 最近看过的日韩成人| 中文字幕av在线一区二区三区| 日本v片在线免费观看| 亚洲国产精品免费| 欧美18免费视频| 久久精品二区| 91一区二区在线| 日本国产在线| 伊人久久久久久久久久久| 欧美日韩激情在线一区二区三区| 亚洲高清视频在线观看| 亚洲视频网在线直播| 青青青草视频在线| 欧美亚洲一区在线| 久久精品久久99精品久久| 无限资源日本好片| 日韩欧美中文字幕公布| 日本午夜精品| 丰满女人性猛交| 亚洲国产中文字幕在线视频综合| 中文字幕乱码中文乱码51精品| 国产精品电影观看| 国产剧情一区二区三区| 日本天堂在线| 欧美激情高清视频| 免费的成人av| 在线看的av| 久久精品电影网| 国产一区成人| 精品一二三四| 美女福利精品视频| 日韩成人av影视| 午夜影院在线免费观看| 蜜臀久久99精品久久久久久宅男| 久久久水蜜桃av免费网站| 成人动漫av| 美女福利视频一区| 日本aⅴ亚洲精品中文乱码| 一级片在线播放| 欧美亚洲国产另类| 成人黄色国产精品网站大全在线免费观看 | 久久久久久久性| 丰满大乳少妇在线观看网站| 国产一区二中文字幕在线看| 成人高清视频免费观看| v天堂福利视频在线观看| 欧美自拍视频在线观看| 成人午夜在线视频| 国产探花视频在线观看| 国产一区二区三区免费不卡| 亚洲五码中文字幕| 91蝌蚪精品视频| 妞干网在线视频观看| 亚洲电影免费观看高清完整版在线| 久久久久久美女精品| 又黄又免费的网站| 久久夜色精品国产欧美乱| 国产一区啦啦啦在线观看| av毛片在线免费| aa日韩免费精品视频一| 一区二区三区国产豹纹内裤在线| 日韩在线观看中文字幕| 国产高清av在线播放| 亚洲视频视频在线| 极品美女销魂一区二区三区| 影音先锋在线视频| 久久精品一二三区| 欧美日韩午夜在线| 亚洲免费黄色| 午夜在线免费观看视频| 97超级碰碰| 欧美体内she精视频| 在线视频亚洲| 成人日日夜夜| 日韩在线第一区| 精品国产电影一区二区| 肉丝袜脚交视频一区二区| 理论片午午伦夜理片在线播放| 精品国产一区二区三区麻豆免费观看完整版 | 国产精品免费在线| 色综合激情五月| 亚洲最新色图| 粉嫩av一区| 欧美国产视频在线观看| 日韩亚洲欧美一区二区三区| 日韩精品色哟哟| a级片免费在线观看| 亚洲天堂第一区| 在线一区二区日韩| 91免费观看国产| 88久久精品| 成人影院在线观看视频| 欧美又大又硬又粗bbbbb| 亚洲一区二区三区影院| 亚洲二区免费| 大胆人体一区二区| 欧美午夜性生活| 国产精品一区二区三区免费视频| 色婷婷久久综合| 蜜臀久久99精品久久久久久9| 欧美日韩精品免费观看视完整| 日韩激情视频一区二区| 欧美激情视频在线| 亚洲一区二区三区视频在线播放| 激情视频一区二区三区| 97久久人人超碰caoprom| 1024精品视频| 国产精品96久久久久久又黄又硬 | 黄色成人在线看| 97精品在线观看| 亚欧色一区w666天堂| 亚洲三级电影在线观看| 精品91久久| 免费男女羞羞的视频网站中文字幕| 成人免费福利视频| 亚洲国产成人久久综合| 欧美国产精品一区二区三区| 综合国产在线| 韩日一区二区| 中文字幕在线视频网|