国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具! 原創

發布于 2025-7-10 15:53
瀏覽
0收藏

編輯 | 伊風

馬斯克,又雙叒叕意料之中地遲到了。

Grok 4 原定的直播足足晚了一個小時,馬老板終于姍姍來遲,開始了這場發布會。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

更加推遲上線的,則是大家原以為會同步上線的編程模型 Grok 4 Code —— 直接鴿到下個月發布,讓人有些小失望。

不過,接下來的幾個月,xAI 還將陸續推出一款多模態智能體,以及一款具備視頻理解與生成能力的綜合模型。可以說從7月到10月,Grok 4家族都持續有大動作出來,值得期待。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

回到這場直播,Grok 4 成為了絕對的主角。

本次共發布兩款模型:

  • Grok 4
  • Grok 4 Heavy:xAI 稱其為“多智能體版本”,多個 Grok 4 協同工作,性能進一步提升。

“Grok 4 是全球最強大的 AI 模型。”

 馬斯克在直播中說:“它在所有學科上的學術水平都超過博士,無一例外。如果到明年 Grok 還沒發現點新的科學知識,我會感到很驚訝。”

Grok 4 Heavy 在列出的各項學術基準測試中全面登頂,拿下 SOTA。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

價格也拉開了差距:

  • 普通版(Grok 4)為 每月 30 美元
  • 超大杯(Grok 4 Heavy)則高達 每月 300 美元!

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

整場直播的演示環節不像上次Grok 3的發布如此密集。

但仍然有些“整活”環節,讓人印象十分深刻!首先,就是為了展示Grok的語音交互能力,直接在直播里“拉踩”了OpenAI的4o,從下面這個演示里可以看到Grok的助手“伊芙”反應更迅速、語氣更自然。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區

而另一個點,則是此前Grok 3發布時馬斯克就心心念念的AI手搓電子游戲。

到了Grok 4 AI已經做的非常像模像樣了,馬斯克預計明年就有成熟的大型游戲能跑出來:

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

1.碾壓一切的基準成績——這不就是 AGI?

當 Grok 4 的基準成績鋪天蓋地刷屏后,網友們幾乎給出了統一的結論:

這不就略等于是 AGI了嗎?

從官方發布的測試結果來看,Grok 4 在多個標桿級任務中全面碾壓對手,毫無懸念地登頂各項榜單,成為當前最強的 SOTA 模型。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

比如在 AI 社區關注的 Artificial Analysis 綜合測評中,Grok 從上代的 67 分,躍升至 73 分,實現了明顯的跨代突破。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

而在ARC-AGI基準中,Grok 4也直接飛升,將一眾對手遠遠甩在后面。

這項測試的難度在于,它不是傳統的問答題,而是要求 AI 具備圖形推理、模式識別等“類人類直覺”能力,被視為檢驗“是否具備 AGI 潛力”的試金石。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

而在外界稱為“人類最后一場考試”(Humanity’s Last Exam)的評估中,Grok 4 Heavy 更是以 44.4% 的高分拔得頭籌,遠超 Gemini 和 OpenAI 的 o3 模型。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

甚至在 Claude 曾參與過的“售貨機模擬商戰”實驗中,Grok 也橫空出世,成為最會賺錢的 AI 商人:

  • 最終凈利潤是 Claude 的兩倍多
  • 執行時長更長

之所以有這么出色的戰績,是因為Grok 4能有效地制定策略,并在長時間內保持一致性。

他們還提了一個超級瘋狂的計劃:如果有辦法把GPU的成本打下來。就可以嘗試搞一百萬臺自動售貨機,然后穩穩賺47億美元。。。

值得一提的是,Grok 4和Claude 4都超過了人類的經商水平。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

不過,面對如此夢幻的數據,我們也不能全然“上頭”,還是可以潑一點冷水:

首先,官方數據可能具備一些水分。例如,據此前披露,Grok 3 的部分成績采用了consensus@64”的方式,也就是一題跑 64 次,挑最好的結果出來展示——而對比模型則大多是“一次跑完”的標準流程,這顯然是個有些討巧的“刷榜”策略。

所以,Grok 4 的實際能力還需要權威的獨立榜單來進一步驗證,建議大家蹲蹲民間榜單,綜合評估。

此外,這次 Grok 4 能打得這么猛,也離不開一個“外掛”:

 它已經掌握了調用工具(tools)的能力 —— 不再是光靠語言模型硬算,而是能外接計算器、搜索器、甚至模擬瀏覽網頁。看來,模型即Agent也是一個大趨勢。

2.訓練飛躍:首次在訓練階段引入工具使用

在 Grok 4 的訓練過程中,xAI 做出了一項意義重大的突破:首次在訓練階段就引入了工具使用機制。不再僅依賴語言模型自身的泛化能力,而是讓模型從一開始就學會如何調用搜索引擎、計算器等外部工具來完成任務。

這不僅是方法上的革新,更帶來了量級上的性能飛躍。

這個操作到底有多猛?看看下面這張圖就懂了——

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

可以說,在“工具使用”這件事上,Grok 4 的可靠性和表現已經把前幾代模型遠遠甩在身后。

而且,也有眼尖的網友發現,Grok 4 heavy之后,性能還有上升空間。據爆料說,xAI內部還有更強的模型因為成本問題沒有發布!

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

不過,團隊也坦言,目前 Grok 使用的工具仍然比較原始。如果拿它與 Tesla 或 SpaceX 等工業場景中的工程工具相比,比如精密的物理模擬和有限元分析系統,它還遠遠不夠。但馬斯克明確表示,今年晚些時候,xAI 將為 Grok 接入這些“真正的商業級工具鏈”,讓它具備解決現實科技問題的能力。

而馬斯克也提出,終極形態是將 Grok 與 Optimus(人形機器人)結合,實現 AI 主動感知并操作現實世界。

一旦模型擁有了物理交互能力,它就可以自己“動手試驗”、修正假設、驗證反饋。換句話說,AI 不只是坐在云端思考,而是走進現實世界動手改造它。這將給整個 AI 硬件生態帶來顛覆性的沖擊。

在Grok他們看來,通向 AGI 的路徑,已經不再是“算力夠不夠”這么簡單的問題,而是一個“算力 + 工具 + 實體交互能力”三位一體的大模型工程。

而馬斯克也展望說一旦AI具備了該項能力,將引爆一個數千倍甚至百萬倍規模的新經濟體。

3.寫在最后:Gemini 3、GPT-5都在路上了

雖然 Grok 4 的發布引發熱議,但戰局遠未塵埃落定。

據X上的網友爆料,Gemini 3 很快就要登場了。谷歌最近的迭代速度真的既快又狠,眼見要成為領跑者了。

訂閱費300刀,值嗎?馬斯克發布Grok 4登頂SOTA!一項突破上大分:訓練階段就教AI用工具!-AI.x社區圖片

而根據奧特曼此前的透露,GPT-5 將在今夏發布,照這個節奏,接下來一到兩個月內,大模型圈還會有更多炸點。

有網友說得很形象:

 “哪有什么AI撞墻期?根本看不到墻在哪里!” 

你看好今天發布的Grok 4嗎?

或者,你覺得下個最令人期待的大模型會是哪一家推出的?評論區聊聊你的觀點。

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
欧美久久久影院| 久久久精品一区| 久久久一本精品99久久精品66| 日本中文字幕一区二区| 亚洲欧美偷拍卡通变态| 中文字幕久久综合| 天天综合一区| 九九热视频这里只有精品| 黄色在线免费看| 国产精品第13页| 伊人av成人| 欧美伊人久久| 4388成人网| 乡村艳史在线观看| 亚洲一级电影视频| 97xxxxx| 日韩不卡手机在线v区| 国产精品久久久久久五月尺| 国产成年精品| 亚洲乱码av中文一区二区| 国产美女视频一区二区三区| 亚洲黄色小说网站| 成人网18免费网站| 久久综合免费视频| 黄频免费在线观看| 欧美一二三四区在线| 一区二区三区性视频| 亚洲欧美另类在线| 国产aaaaa毛片| 91婷婷韩国欧美一区二区| 一区二区在线观| 丝袜亚洲另类丝袜在线| 操人视频欧美| 一区二区电影在线观看| 国产精品三级网站| 国产一区二区欧美| 欧美洲成人男女午夜视频| 亚洲综合色婷婷在线观看| 日韩亚洲在线观看| 欧美性www| 久久精品久久久久久国产 免费| 国产无遮挡裸体视频在线观看| 欧美电影影音先锋| av电影在线播放高清免费观看| 性做久久久久久免费观看欧美| 色噜噜狠狠一区二区| 国产精品久久久久久久久免费樱桃| 黑森林福利视频导航| 久久久久久一二三区| 国产一区视频免费观看| 久久久噜噜噜久久人人看| 97视频在线免费播放| 久久理论电影网| 天堂在线资源视频| 亚洲视频免费看| 中文字幕校园春色| 色综合天天性综合| 在线观看免费黄视频| 欧美一级搡bbbb搡bbbb| 国产乱码在线| 亚洲精品在线看| 日本高清不卡一区二区三区视频 | 亚洲色图.com| 含羞草激情视频| 亚洲国产一区二区三区青草影视| 中文字幕在线视频网| 欧美日韩一区二区三区视频| 欧美xxxbbb| 久久久久北条麻妃免费看| 久久精品亚洲成在人线av网址| 国产精品极品在线| 精品不卡视频| 最新黄色av网站| 久久久久综合网| 头脑特工队2免费完整版在线观看| 欧美日韩大陆在线| 91超碰碰碰碰久久久久久综合| 高清在线视频日韩欧美| 国产精品福利在线观看播放| 日韩精品伦理第一区| 久久蜜桃av一区二区天堂| 日本久久久久亚洲中字幕| 成人性生交大片免费| 日日摸天天爽天天爽视频| 欧洲亚洲精品在线| 在线观看精品视频| www欧美成人18+| metart日本精品嫩模| 国产剧情演绎av| 久久九九99视频| 亚洲成人av高清| 亚洲精品成人久久| 久久爱www.| 91av免费看| 成人深夜视频在线观看| 国产.com| 亚洲高清av在线| 欧美18xxxx| 亚洲成人蜜桃| 亚洲精品国产高清久久伦理二区| 久久久久久久久免费视频| 欧美激情欧美激情在线五月| 亚洲欧洲综合| 成年人视频在线免费| 欧美日韩卡一卡二| 日韩中文字幕无砖| 欧美精品免费观看二区| 欧美国产一区二区| 伊人手机在线| 国产精品久久久久av| 男人天堂欧美日韩| 3d黄动漫网站| 亚洲奶大毛多的老太婆| 中文字幕一区二区三区久久网站 | 91白丝在线| 国产精品99久久久久久白浆小说| 久久99精品国产.久久久久久| 男女午夜视频在线观看| 日韩成人免费视频| 海角社区69精品视频| 999www成人| 国产亚洲精品久久久| 亚洲国产高清一区| 欧美黑人孕妇孕交| 欧美成人午夜剧场免费观看| 麻豆精品在线播放| 粉嫩av一区| 国产精品中文久久久久久久| 国产欧美精品一区aⅴ影院| 小早川怜子影音先锋在线观看| 国产经典一区二区三区| 亚洲精品成人在线| 欧美久久亚洲| 成人免费网站入口| 日韩精品自拍偷拍| 欧美日韩在线大尺度| 黄色免费观看网站| 久久91亚洲精品中文字幕| 国产一区91精品张津瑜| 欧美色图天堂| 欧美中日韩一区二区三区| 懂色av中文一区二区三区天美| 美女午夜精品| 不卡av免费在线| 日韩在线观看av| 风间由美一区二区三区在线观看| av黄在线观看| 茄子视频成人在线观看| 欧美少妇bbb| 伊人久久亚洲热| 黄上黄在线观看| 99re在线播放| 欧洲亚洲国产日韩| 精品成人在线| 69视频在线观看| 欧美久久久久久| 日韩欧美自拍偷拍| 视频一区二区三区在线| 日本中文字幕中出在线| 欧美一区二区三区成人久久片| 9191久久久久久久久久久| 精品动漫3d一区二区三区免费版| 国产日本在线观看| 精品一区二区不卡| 欧美第一区第二区| 国产一区二区三区综合| 成人国产在线| 99草草国产熟女视频在线| 久久久久中文字幕2018| 亚洲欧美日韩在线| 日韩欧美二区| 日本中文字幕在线2020| 亚洲永久激情精品| 伊人久久五月天| 国产精品美女一区二区在线观看| 亚洲制服一区| 成人亚洲综合天堂| 视频一区视频二区视频| 亚洲色图美腿丝袜| 国产亚洲女人久久久久毛片| xxx亚洲日本| 国产精品无码乱伦| 国产精品日韩一区二区| 国产ts一区二区| 97视频在线观看免费| 国内揄拍国内精品| 日韩av电影免费观看高清| 亚洲丝袜在线视频| 日韩欧美成人一区二区| 国产欧美视频在线观看| 奇米影视7777精品一区二区| 国产精品黄色影片导航在线观看| 99国产精品久久久久久久成人热 | 欧美性猛交p30| 激情婷婷综合网| 日本在线免费观看一区| 久久精品电影网站| 精品少妇一区二区三区| 亚洲精品视频在线看| 黑人精品xxx一区|