国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

戰報:馬斯克Grok4笑傲AI象棋大賽,DeepSeek沒干過o4-mini,Kimi K2被喊冤

人工智能 新聞
Grok 4表現最佳,DeepSeek R1表現強勁,但不敵o4-mini,Kimi K2最慘——都讓網友喊冤了。

最新戰報最新戰報:首屆AI國際象棋對戰……馬斯克家的Grok 4“遙遙領先”了。

是的,谷歌給大模型整了個國際象棋比賽:Kaggle AI象棋競賽。

在首日對決之后,參賽選手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一輪較量,結果——

Grok 4表現最佳,DeepSeek R1表現強勁,但不敵o4-mini,Kimi K2最慘——都讓網友喊冤了。

圖片

眼見自家Grok 4表現出色,馬斯克當然不會錯過PR良機,不過回應略顯凡爾賽:

我們沒有刻意去訓練,這只是一個副作用。

圖片

u1s1誰又能為這么個“無厘頭”比賽專門刻意訓練呢?

當然,讓AI對戰國際象棋,過程比輸贏重要多了,畢竟谷歌發起這次比賽的初衷,就是測試“涌現”能力。

首屆Kaggle AI國際象棋競賽

本次比賽由谷歌發布,作為推廣Kaggle游戲競技場的一個環節。首次比賽以國際象棋開始。

參賽“選手”包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4。

8月5日至8月7日每天10:30(太平洋時間)準時直播賽況。

圖片

除了各個頂級模型的象棋對決,直播還邀請了國際象棋特技大師中村光(Hikaru Nakamura)作為講解。

他于7歲那年開始學習國際象棋,到15歲時成為全美國際象棋冠軍并拿到GM頭銜,也是本屆EWC國際象棋(迄今為止規模最大的國際象棋錦標賽)的季軍。

圖片

在一天的角逐后,目前挺入半決賽圈的是Gemini 2.5 Pro、Grok 4、ChatGPT的o4-mini和o3。

吃瓜群眾坐等看ChatGPT的o4-mini和o3的“內斗”,以及Gemini 2.5 Pro對戰Grok 4。

圖片

并且,所有在八分之一決賽中的比賽都以完美的4-0結束。實力差距非常明顯。

網友們分析了這次賽況,表示Grok 4在這次基準測試中“在戰術策略和速度上超越了所有其他模型”。

圖片

可是等等,現在不是才八進四么?這么快就下結論了?

讓我們一起看看各模型的具體表現,是什么讓網友作出了如此高的評價:

Grok 4 vs Gemini 2.5 Flash

Grok4如同猛獸, 它輕松的表現就像“真正的GM”一樣下棋,成為當天最佳。

另一方面,Gemini Flash從一開始就處于劣勢,包括開局時吃王。

圖片


OpenAI o4-mini vs DeepSeek R1

在OpenAI o4-mini對陣DeepSeek R1的賽程中,R1開局強勁,但最終輸給了o4-mini。

比賽中雙方都犯了不少錯誤,但o4-mini率先抓住了R1犯下的失誤。

R1提供的推理雖然自信卻錯誤,而且對棋盤局勢的缺乏洞察導致它留下了棋子給o4-mini率先拿走。

圖片


Gemini 2.5 Pro vs Claude Opus 4

這場Gemini 2.5 Pro和Claude Opus 4的對陣是當天最佳對局,兩個模型都展示了高水平的棋藝。

Claude出現一些失誤,而Gemini Pro展現了強大的戰術視野,但給出的分析有時過于冗長。

圖片

Kimi K2 對陣o3

這是最快的四分之一決賽,Kimi K2被“碾壓”,主要是因為它反復堅持走非法棋步,o3以棄權獲勝,沒有太多值得分析的表現。

不過也有人替Kimi鳴不平:因為Kimi不是推理模型,長思考才能有更好的性能,步驟越往后,越需要長思考。

圖片

為什么是國際象棋?

所以為什么要選國際象棋來讓AI對戰?

這么說吧,國際象棋規則明確但復雜度高(10^120種可能局面),是測試AI決策能力的理想場景。

雖然有網友會產生誤讀,認為它是“越大越優”,但實際上,這個數字已經遠超窮舉法的適用范疇。

圖片

前些時間,陶哲軒在Lex訪談中提到:有些數學問題無法直接通過暴力計算來解決。例如國際象棋排列的數量,我們至今無法用計算機完全解決,但我們現在有AI,它們不會探索博弈樹中的每個位置,而是尋求近似值。

圖片

換句話講,讓AI去下國際象棋,考驗的其實是AI的涌現能力

有位網友也關注到了這點,并對這次Grok 4的表現做出了總結:

圖片

這位網友表示,在傳統AI中,模型實力源于領域特定訓練模(為任務量身定制);而在前沿AI中,模型實力源于一致性泛化(進化出能夠映射到一切事物的內部世界結構)。國際象棋只是其中一種投射。

網友們普遍認為,國際象棋是一種很可靠的評估AI能力的方式。

圖片

也有網友對AI的下一個競技游戲進行了預測:或許會是UNO?(當然是開玩笑)

圖片

圖片

哪個AI最被看好?

在Kaggle AI象棋競賽正式開始之前,有網友在Manifold上發起了一個投票:誰會是這場AI象棋競賽的最終勝者?

起初,Gemini 2.5 Pro是最受歡迎的,o4緊隨其后。

圖片

但在八進四比賽后,該投票發生了明顯變化,Grok 4呈現壓倒性優勢。

圖片

不過越是這樣就越讓人期待,會不會出現什么抓馬的意外呢?

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-08-11 14:12:35

GPT-4oAIGrok 4

2025-08-07 09:20:00

2025-07-11 11:58:59

多智能體Grok 4AI

2023-12-13 08:46:33

人工智能ChatGPT機器人

2025-07-10 16:58:04

2025-06-30 01:00:00

2023-12-12 17:53:27

馬斯克AIChatGPT

2025-07-14 14:36:29

馬斯克Grok 4AI

2025-07-14 01:55:00

2024-08-15 10:07:03

2024-03-29 12:48:00

數據訓練

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2025-09-23 09:18:40

2025-09-22 11:36:10

2024-03-18 14:17:06

大模型開源人工智能

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2025-02-11 11:19:52

2025-04-23 08:30:05

2025-07-15 18:08:04

2025-09-19 09:10:00

點贊
收藏

51CTO技術棧公眾號

欧美精品一区在线发布| 日日摸夜夜添夜夜添精品视频| 色爱综合区网| 影音成人av| 国产盗摄一区二区三区| 欧美xxxx做受欧美.88| 69久久久久久| 久久国际精品| 亚洲天堂2016| 欧美一区激情视频在线观看| 久久久久久久久久久91| 成人在线播放| 亚洲伊人伊色伊影伊综合网| 永久免费看av| 午夜在线视频一区二区区别| 国产精品欧美风情| 久久丁香四色| 中文字幕精品—区二区| 18av在线视频| 色综合天天综合网天天狠天天| 隔壁人妻偷人bd中字| 亚洲欧美一二三| 亚洲最色的网站| 久久综合久久网| 懂色av中文在线| 国产对白叫床清晰在线播放| 久久精品高清| 欧美一级午夜免费电影| 亚洲第一页在线视频| 日韩欧美一区二区三区久久| 98精品在线视频| 国产日韩精品在线看| 精品久久久久久久久久久下田| 亚洲大型综合色站| 国产又爽又黄ai换脸| 999国产在线视频| 免费精品一区| 色综合久久久久综合体| youjizz.com在线观看| 久久精品黄色| 欧美国产精品一区| 99在线热播| 精品亚洲porn| 欧美高潮视频| 日韩精品小视频| 一区二区三区毛片免费| 日本一区免费看| 亚洲不卡视频| 精品成人乱色一区二区| 日韩精品一区二区在线视频 | 欧美黑人激情| 欧美变态口味重另类| 亚洲精品一区二区三区在线| 国产精品中文在线| 丁香亚洲综合激情啪啪综合| 国产福利电影网| 亚洲精品国精品久久99热| 牛牛精品成人免费视频| 日韩精品一二三四区| 色爱综合网站| 在线成人激情黄色| 爱情电影社保片一区| 亚洲免费一在线| ww久久综合久中文字幕| 精品国产一区av| 亚洲国产欧美国产第一区| 国内久久久精品| 国产免播放器视频| 日韩精品中文在线观看| 97国产视频| 久久成人久久爱| 九色视频网站| 亚洲视频你懂的| 国产经典av| 图片区小说区区亚洲影院| av中文天堂在线| 精品久久久久久久久久久久包黑料 | 9191成人精品久久| 在线看一级片| 日韩小视频网址| 教室别恋欧美无删减版| 国产欧美综合精品一区二区| 日韩精品一卡二卡三卡四卡无卡| 亚洲色图都市激情| 亚洲国产精品成人综合| 男人天堂综合| 国产视频久久网| 成人激情自拍| 精品国产乱码久久久久软件 | 香蕉97视频观看在线观看| 日韩免费电影一区| 免费看日产一区二区三区 | 美女91在线看| 91精品国产高清久久久久久| 国产精品videosex极品| 丝袜美腿玉足3d专区一区| 久久综合狠狠综合久久综合88 | 色综合久久影院| zzjj国产精品一区二区| 成人黄色av| 亚洲成年人专区| 亚洲综合一区在线| 波多野结衣中文在线| 国产999在线| 另类小说视频一区二区| 久草福利资源在线视频| 日韩精品在线免费播放| 成人羞羞动漫| 欧美视频免费看欧美视频| 欧美日韩国产一中文字不卡| 人在线成免费视频| 91精品国产自产在线老师啪| 国产99精品视频| 污网站在线看| 欧美黑人狂野猛交老妇| 日韩精品1区2区3区| 免费一级网站| 国产一区二区三区免费视频| 91精品国产乱码久久久久久| 男人日女人bb视频| 日韩色在线观看| 先锋资源久久| 先锋影音资源综合在线播放av| 亚洲国产日韩欧美在线99| 99精品视频在线观看播放| 国产男女在线观看| 日韩久久久精品| 欧美在线高清| 91佛爷在线| 在线日韩欧美视频| 久久中文在线| 丝袜视频国产在线播放| 欧美巨乳在线观看| 国产一区二区在线影院| 在线a人片免费观看视频| 国产精品扒开腿做爽爽爽视频 | 精品美女在线观看视频在线观看| 8x拔播拔播x8国产精品| 粉嫩绯色av一区二区在线观看| 国产美女av在线| 91亚洲精品久久久| 亚洲色图都市小说| 99re热精品视频| 我的公把我弄高潮了视频| 亚洲第一色在线| 久久精品系列| 在线看的av网站| 高清视频一区| 色婷婷精品大视频在线蜜桃视频| 国产91久久精品一区二区| 在线看片地址| 欧美极品美女视频网站在线观看免费 | 日韩免费精品视频| 日本一区二区视频在线| 96sao精品免费视频观看| 全黄性性激高免费视频| 日韩电影大全免费观看2023年上 | 欧美日韩国产999| 91免费版在线看| 欧美日韩免费电影| 日本福利视频在线观看| 国产午夜精品视频免费不卡69堂| 蓝色福利精品导航| 草草视频在线观看| 中文字幕一区二区三区四区五区六区 | 欧美大肚乱孕交hd孕妇| 美女黄网久久| 丝袜中文在线| 在线成人av电影| 伊人一区二区三区久久精品| 国产精品一区二区无线| 成人在线黄色| 十八禁视频网站在线观看| 欧美人与性动交a欧美精品| 国产亚洲美州欧州综合国| 久久亚州av| 福利视频午夜| 91久色国产| 精品久久久久香蕉网| 国产成人综合在线| 日韩视频一二区| 老司机午夜激情| 91视频国产高清| 日韩亚洲欧美一区| 国产精品一区在线| 午夜成人在线视频| 国内成人免费视频| 亚洲一区二区日韩| 中文有码一区| 涩涩视频在线播放| 亚洲性图自拍| 春暖花开成人亚洲区| 99精品视频网站| 国产成人av网址| 亚洲va欧美va国产va天堂影院| 欧美日本一区二区高清播放视频| 一区二区三区视频免费视频观看网站| 欧美日本中文| 色视频在线播放| 欧美重口乱码一区二区|