国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

馬斯克20萬塊GPU煉出Grok-3,暴擊DeepSeek R1數(shù)學(xué)屠榜!瘋狂復(fù)仇OpenAI

人工智能 新聞
馬斯克口中全世界最聰明大模型Grok-3,終于震撼登場(chǎng)!20萬塊GPU訓(xùn)出的模型,實(shí)屬全球首次。果然,Grok-3已火速屠榜多個(gè)排行榜,擊敗o3-mini(high)和DeepSeek-R1。

人類史上首個(gè)在20萬塊GPU上訓(xùn)出的模型終于問世!

剛剛,馬斯克帶隊(duì)三位xAI成員在線開啟直播,官宣Grok-3全家桶——

Grok-3(Beta)、Grok-3 mini

首個(gè)推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning:擊敗o3-mini/DeepSeek-R1,解鎖推理時(shí)計(jì)算

首個(gè)AI智能體「DeepSearch」:聯(lián)網(wǎng)深入搜索

一股OpenAI發(fā)布會(huì)的味道撲面而來

據(jù)介紹,三代Grok的訓(xùn)練計(jì)算量竟是Grok-2的10倍,那么實(shí)際表現(xiàn)又如何?

世界最大超算集群Colossus已有20萬塊GPU:10萬塊GPU同步訓(xùn)練(第一階段用時(shí)122天搭建);20萬GPU(第二階段用時(shí)92天)

在多項(xiàng)基準(zhǔn)測(cè)試中,Grok-3在數(shù)學(xué)(AIME 2024)、科學(xué)問答(GPQA)、編碼(LCB)上刷新SOTA,大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o。

Grok-3 mini的性能基本上領(lǐng)先或媲美其他閉源/開源模型。

在著名大模型LMSYS Arena排行榜中,Grok-3(chocolate終于揭秘)刷榜,Elo評(píng)分超1400位列最高,沒有任何一個(gè)模型能與之相比。

Grok-3的數(shù)學(xué)能力十分驚人,幾乎能完成大部分美國數(shù)學(xué)專業(yè)能力測(cè)試的題目。

更令人驚喜的是,Grok-3此次還帶來了推理模型——Grok-3 Reasoning,在回答問題時(shí)會(huì)展示出思維過程。

進(jìn)入聊天入口,直接選擇「Think」模式,即可開啟魔法。

此外,還有「Big Brain」模式、智能體「深度搜索」(Deep Search)模式同步上線。

幾天前,馬斯克曾在預(yù)告中放出豪言,「這是地球上最聰明的AI」,此言不虛。

總愛搞點(diǎn)事情的奧特曼,一會(huì)兒說GPT-4.5讓自己深刻感受到AGI,一會(huì)兒又要開源模型全網(wǎng)投票。

甚至有網(wǎng)友提議,不如咱就7:30pm發(fā)布GPT-4.5吧!奧特曼:這不太好吧。

奧特曼的這番言論,擺明了是要擾亂軍心。據(jù)傳言,Grok-3發(fā)布這一歷史性時(shí)刻,OpenAI全員觀戰(zhàn)。

OpenAI前腳發(fā)布的o3-mini剛剛擊敗了R1,如今又被Grok-3追回。不知今晚,GPT-4.5會(huì)不會(huì)降臨?

暴擊o3-mini、DeepSeek-R1,解鎖測(cè)試時(shí)計(jì)算

有人說,Grok-3是終極的Scaling Law測(cè)試,如今看來,事實(shí)如此。

從2023年Grok-1首次面世,到Grok-1.5,再到Grok-2逐步迭代,模型推理性能飛速飆升的同時(shí),還吞噬了大量的算力。

Grok-3家族,更是將「測(cè)試時(shí)計(jì)算」發(fā)揮到了極致。10萬塊H100超算,訓(xùn)出的野獸幾乎無「模」能敵。

它成為首個(gè)Elo評(píng)分打破1400的模型,在所有分類測(cè)試中位列第一。

在多項(xiàng)基準(zhǔn)測(cè)試中,推理模型Grok-3 Reasoning和Grok-3 mini Reasoning在數(shù)學(xué)、科學(xué)、編碼上,性能均大幅超越o3-mini(high)、o1、DeepSeek-R1,還有Gemi-2 Flash Thinking。

可以說,迄今為止最強(qiáng)「推理模型」,全部敗給了Grok-3 Reasoning,可以說,它是名副其實(shí)的「世界上最聰明的模型」。

團(tuán)隊(duì)表示,允許Grok去進(jìn)行更長時(shí)間的思考和推理。

在最新的數(shù)學(xué)基準(zhǔn)AIME 2025上,Grok-3兩款新模型性能同樣刷新SOTA,分別拿下了93和90分。

順便提一句,Grok-3思維鏈和o3-mini套路一樣——防止被偷家xAI掩蓋了部分思考過程。

接下來,讓我們一睹Grok-3強(qiáng)大的推理能力。

高級(jí)推理Think

首先是一個(gè)太空飛船任務(wù),生成一個(gè)地球發(fā)射、火星著陸以及下一次發(fā)射窗口返回地球的動(dòng)畫3D代碼。

注意,這個(gè)問題的難點(diǎn)在于,過程中涉及到了大量數(shù)學(xué)和物理模型的計(jì)算。在此之前,團(tuán)隊(duì)從未試過讓大模型去計(jì)算航天的發(fā)射窗口。

在「Think」模式下,可以看到Grok的思維痕跡,甚至可以進(jìn)去看看Grok在解決問題時(shí)到底在想什么。

Grok 3很快生成了完整可運(yùn)行的3D動(dòng)畫。在代碼中,Grok-3數(shù)值上求解了開普勒定律。

下圖是3D動(dòng)畫的畫面,直觀展示了任務(wù)過程中,太陽、地球、火星和飛船之間的位置關(guān)系。

甚至,宇航員可以據(jù)此直接算出出艙時(shí)間和距離。這上面有地球-火星往返的轉(zhuǎn)移路徑,這種穿越每26個(gè)月發(fā)生一次。接下來,我們現(xiàn)在正處于一個(gè)過渡窗口期。

研究者經(jīng)過檢查后激動(dòng)表示:Grok-3給的答案完全正確!

最后馬斯克揭開謎底:其實(shí),這就是SpaceX真正的探索軌道。他充滿信心地表示,兩年內(nèi),地球和火星就會(huì)被連接在一起。

很快有網(wǎng)友評(píng)論,「可以確認(rèn),Grok-3強(qiáng)得離譜!」

與之相對(duì)比的是,o1、o1-pro、o3-mini(high)全都在這個(gè)問題上栽了:生成一段代碼,實(shí)現(xiàn)從地球發(fā)射、登陸火星,然后在下一個(gè)發(fā)射窗口返回地球的3D動(dòng)畫。

「它們生成的代碼能跑是能跑,但很不幸,飛船根本就沒靠近過火星,更別說回來了。」該網(wǎng)友表示。

然后團(tuán)隊(duì)又讓Grok-3制作一個(gè)游戲。要求是結(jié)合俄羅斯方塊和寶石迷陣兩個(gè)游戲的混合體。

「顯然,如果你讓AI去創(chuàng)作一款像俄羅斯方塊這樣的游戲,互聯(lián)網(wǎng)上有許多例子,或者類似寶石迷陣的游戲。它可以復(fù)制它們。」演示人員表示。

所以,現(xiàn)場(chǎng)他們讓Grok-3制作了一個(gè)結(jié)合了俄羅斯方塊和寶石迷陣兩個(gè)游戲的混合體,這次他們使用了「Big Brain」模式,可以使用更多計(jì)算能力的一種模式。

Grok-3隨后開始使用python編寫代碼,可以看出它調(diào)用了pygame、random和time這3個(gè)庫來完成游戲的編寫。

代碼完成后,Grok-3生成的俄羅斯方塊和寶石迷陣兩個(gè)游戲的混合體成功運(yùn)行,雖然游戲邏輯有些隨意,但是界面挺美觀。

「我們?cè)趚.ai準(zhǔn)備好成立一個(gè)游戲工作室了嗎?」演示人員激動(dòng)地說道,「是的,所以我們正在x.ai啟動(dòng)一個(gè)人工智能游戲工作室。」

在此過程中,研究者們討論道:最好的AI模型,必須像人類一樣思考,會(huì)去想所有可能的對(duì)策和解法,會(huì)自我批評(píng)、回溯,還會(huì)從第一性原理去思考。

甚至,Grok能夠了解自己的邏輯和推理過程中的一些失誤所在,更正自己的錯(cuò)誤,將一些數(shù)學(xué)推理過程概念化,而現(xiàn)實(shí)生活中,也正是這些問題的延伸。

研究者表示,真正令人興奮的就是,可以用Grok-3去完成現(xiàn)實(shí)世界中的任務(wù),比如打造一輛特斯拉,或者去發(fā)射火箭。

這正是Grok團(tuán)隊(duì)目前正在思考的問題。

深度搜索DeepSearch

沒想到,這一次馬斯克還帶來了Grok-3首個(gè)智能體——DeepSearch。

DeepSearch是Grok的第一代智能體,能夠在互聯(lián)網(wǎng)上進(jìn)行更深入的搜索。

它允許用戶對(duì)互聯(lián)網(wǎng)和X平臺(tái)進(jìn)行全面搜索。該模式分析大量信息,并通過快速高效的搜索過程提供詳細(xì)、合理的答案。

此外,它的信息檢索過程對(duì)用戶更加透明。你可以直接告訴它只使用來自X的內(nèi)容,它會(huì)盡量遵守這個(gè)要求,因此可控性更強(qiáng),也更智能。

我們可以問DeepSearch智能體:下一次星艦發(fā)射是什么時(shí)候?

可以看到,在左邊,它展示出了搜索和推理的過程,而在右邊,則展示出了深度思考過程,以及模型正在瀏覽什么樣的網(wǎng)址和網(wǎng)頁。

最終,智能體給出了答案:25年2月24日。

游戲玩家還可以提問:在Poe 2中最硬核的流派是什么?

除了給出答案——煉獄師召喚流之外,智能體還在回答中給出了如何獲得更多武器的攻略。

因此,比起現(xiàn)在普通的搜索引擎,使用Grok智能體能節(jié)約更多的時(shí)間。

Grok團(tuán)隊(duì)表示,從此,或許所有實(shí)習(xí)生都要失業(yè)了,我們需要的只是向大模型下任務(wù)。每個(gè)月花40美元,就能帶來數(shù)十億美元的回報(bào)。

馬斯克:一周內(nèi)所有功能上線,幾個(gè)月內(nèi)全面開源

所以,Grok-3到底什么時(shí)候開放?

對(duì)此,馬斯克表示,訂閱Premium Plus的X用戶現(xiàn)在已經(jīng)可以用上了。

而Grok忠實(shí)粉絲則可以單獨(dú)訂閱SuperGrok,從而解鎖深度搜索和思考模型等先進(jìn)功能,并成為早體驗(yàn)新特性的那一波。

全新網(wǎng)址是grok.com,另外App Store里也可以下載了。

馬斯克強(qiáng)調(diào),最新版本一定是網(wǎng)頁版,App Store里是比較落后的。

目前,Grok-3每天都在更新推理功能,馬斯克放話說:一周內(nèi),Grok的所有功能都將上線!

傳送門:https://grok.com/

Q&A

什么時(shí)候出語音助手版?會(huì)花一周時(shí)間。

Grok-3 API什么時(shí)候上線?幾周內(nèi)。

Grok 3語音模式是原生的,還是文本轉(zhuǎn)語音?它是Grok-3的一個(gè)變體,能理解你說的話,并且直接生成音頻。

Grok-3能否將音頻轉(zhuǎn)錄成文本?沒問題。這個(gè)聲音模型不僅僅是語音轉(zhuǎn)文字那么簡單,它還具備對(duì)話記憶功能,能記得和你之前的交互記錄。

馬斯克表示,幾個(gè)月之后會(huì)對(duì)Grok-3進(jìn)行全面的開源。

Grok-3最令人興奮的部分是什么?訓(xùn)練模型,以及百分百的邏輯推理,都是最難的部分,就像你需要隨時(shí)隨地設(shè)計(jì)宇宙的最新進(jìn)展。

如何設(shè)計(jì)這樣一個(gè)史上最難推理模型?研究者表示,我們花了24個(gè)月去打磨這個(gè)模型,確定它在邏輯推理上有了最新進(jìn)展,同時(shí)他們使用了一個(gè)廢棄工廠,數(shù)據(jù)中心之所以落地在孟菲斯,是因?yàn)榧刃枰懔Γ中枰茉垂δ埽枰?/4吉瓦來向GPU供能,同時(shí)還需要冷卻設(shè)施。

此前,從沒有人真正在數(shù)據(jù)中心實(shí)現(xiàn)過液冷,但Grok團(tuán)隊(duì)做到了!

為了進(jìn)一步對(duì)數(shù)據(jù)中心供能,我們使用了特斯拉的Megapacks,并且重新計(jì)算了建筑物的能源供給。最終證明:團(tuán)隊(duì)的計(jì)算是有效的!

而且,過程中還需要把不同計(jì)算機(jī)聯(lián)結(jié)在一起,共享信息。在此過程中,團(tuán)隊(duì)會(huì)看到模型之間供給不平衡的情況。

一方面,是對(duì)建筑供能和節(jié)能的重新設(shè)計(jì);另一方面,團(tuán)隊(duì)設(shè)計(jì)了大模型,設(shè)計(jì)了全新的算法過程。

研究者表示,不知道其他大模型是否也像Grok-3一樣,需要如此多的人力和物力。

當(dāng)然,團(tuán)隊(duì)也希望在接下來,減少模型的能耗,把數(shù)據(jù)中心的耗能從1/4吉瓦降低下來,或許需要重新設(shè)計(jì),讓它成為世界上效率最高的數(shù)據(jù)中心。

AI大牛高度好評(píng):Grok-3成就驚人

提前拿到內(nèi)測(cè)資格后,AI大佬Karpathy展開了一番評(píng)測(cè),分享的感悟比一篇文章還要長。

總結(jié)來說,Grok-3推理模型最領(lǐng)先,解決了卡坦島(Settler's of Catan)難題。上傳GPT-2論文后,Grok-3完成了簡單的查找問題。

它沒有解決黎曼假設(shè)難題,僅是說「這是一個(gè)偉大未解決的難題」。

在體驗(yàn)「深度搜索」功能時(shí),結(jié)合了思考+深度研究的能力,能對(duì)需要研究、查找的問題提供高質(zhì)量回答,并給出參考鏈接。

最后,Karpathy給出的評(píng)價(jià)是,「Grok-3 + Thinking表現(xiàn)似乎達(dá)到了與o1 Pro(每月200美元)相當(dāng)?shù)乃剑⑶衣詢?yōu)于DeepSeek-R1和Gemini 2.0 Flash Thinking」。

大約一年前,xAI團(tuán)隊(duì)從0開始的,這么短時(shí)間內(nèi)就達(dá)到了頂尖水平,這是前所未有的驚人成就。

Grok-3同樣通過了物理模擬測(cè)試,效果堪比o3-mini。

xAI聯(lián)創(chuàng)同樣表示,「我們改進(jìn)模型和系統(tǒng)的速度,比任何單一的里程碑都更重要。Grok-3證明了我們能夠在19個(gè)月內(nèi)從零起步達(dá)到了最先進(jìn)的水平」。

此外,xAI工程師還曝出了即將上線的「高級(jí)語音模式」

Grok-3橫空出世,再次

把xAI帶回到世界第一梯隊(duì)。

用馬斯克的一句話做個(gè)總結(jié)——要判斷哪家公司會(huì)在技術(shù)競(jìng)爭中勝出,你只需要關(guān)注其創(chuàng)新速度的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)。

xAI團(tuán)隊(duì)勝利的這一刻,值得被記錄。

奧特曼的AGI也準(zhǔn)備就緒。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-02-19 10:28:22

2025-02-19 15:01:09

2025-02-21 10:51:47

2025-07-25 09:25:05

2025-02-19 15:40:44

2025-09-23 09:18:40

2025-02-11 09:20:00

LLM模型AI

2025-09-19 09:10:00

2025-07-10 16:58:04

2025-02-11 11:19:52

2024-07-16 13:29:52

2025-07-08 08:53:00

2025-03-03 08:35:00

DeepSeek模型AI

2024-12-09 14:00:00

AI生成

2023-12-13 08:46:33

人工智能ChatGPT機(jī)器人

2023-11-06 12:34:14

模型訓(xùn)練

2025-03-03 12:59:39

2023-04-12 14:55:46

馬斯克GPU

2024-05-07 13:30:00

數(shù)據(jù)訓(xùn)練

2024-07-23 13:10:20

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲专区在线视频| 欧美一区二区成人6969| 国产精品久久久久久久久久妞妞| 台湾无码一区二区| 中文字幕一精品亚洲无线一区 | 久久国产精品亚洲77777| 韩国成人动漫| 热久久精品免费视频| 91精品综合久久久久久五月天| 精品国产91乱码一区二区三区| 99久久精品99国产精品| 久久久9色精品国产一区二区三区| 国内在线视频| 美女网站视频黄色| 国产精品v欧美精品∨日韩| 日韩精品在线观看一区| 亚洲欧美综合另类在线卡通| 国产午夜精品视频一区二区三区| 99久久精品费精品国产风间由美| 中文在线观看免费| 青青草av网站| 久久久99爱| 操人视频在线观看欧美| 色婷婷综合久色| 成人免费视频网站在线观看| 99国产精品一区二区| 美脚恋feet久草欧美| 国产三级av在线| 激情视频小说图片| 亚洲尤物视频网| 久久精品国产欧美激情| 在线视频观看一区| 久久久国产综合精品女国产盗摄| 99av国产精品欲麻豆| 国产精品chinese在线观看| 黄色av免费在线| 国产对白在线| 日本福利视频导航| 国产美女精品免费电影| 国产亚洲精品美女久久久久| 欧美性猛交xxxx免费看久久久| 97超碰欧美中文字幕| 99精品国产在热久久婷婷| 精品国产导航| 涩涩视频在线| 黄色片在线免费观看| 青青青国产在线视频| 先锋在线资源一区二区三区| 秋霞午夜一区二区| 在线电影av不卡网址| 欧美军同video69gay| 综合网在线视频| 风间由美性色一区二区三区 | 日本高清好狼色视频| 国产日韩第一页| 动漫一区二区在线| 欧洲日韩成人av| 在线视频国产日韩| 欧美丰满美乳xxx高潮www| 一区二区三区国产精品| 99精品视频一区| 麻豆成人91精品二区三区| 欧美日韩国产精品一区二区亚洲| 美女视频亚洲色图| 成人在线高清| 波多野结衣乳巨码无在线观看| 在线观看入口黄最新永久免费国产| www.浪潮av.com| 在线亚洲美日韩| 好吊色欧美一区二区三区| 国产精品国语对白| 久久久综合免费视频| 中文字幕亚洲一区二区三区五十路 | 精品毛片网大全| 国产精品青草综合久久久久99| 国产在线观看一区二区| 亚洲美女少妇无套啪啪呻吟| 色综合久久网| 亚洲第一二三区| 波多野结衣欧美| 激情久久一区二区| 都市激情亚洲一区| tube8在线hd| 久久亚洲天堂| av电影在线观看| 日韩毛片在线一区二区毛片| 国产99re| 国产福利电影网| 97影院理论午夜| 天堂在线资源视频| caopor在线视频| 欧美日韩在线中文| 日本香蕉视频在线观看| 精品国产三级a∨在线| 亚洲国产婷婷香蕉久久久久久99| 女同一区二区| 蜜桃成人在线| 精品不卡在线| 国产传媒一区二区| 亚洲影视九九影院在线观看| 亚洲最大av在线| 99在线视频播放| 成人av免费在线看| 99国产高清| 国产一区二区在线观看免费播放| 成人欧美一区二区| 久久av一区二区| 日韩久久不卡| 色一情一乱一乱一区91| 国产真人做爰毛片视频直播| 97国产在线播放| 91插插插插插插插插| eeuss在线播放| 日本aⅴ写真网站免费| 又黄又爽在线观看| 国产原创av在线| 二区三区四区高清视频在线观看| 日韩少妇视频| 日本一区二区电影| 久久久久久久久成人| 欧美五码在线| 欧美a级成人淫片免费看| 亚洲天堂久久| 日本成人中文字幕在线视频| 黄页网站大全一区二区| 99国产精品国产精品久久| 中文字幕精品—区二区四季| 亚洲综合一区二区| 欧美在线视频日韩| 亚洲国产成人精品一区二区 | 六月激情综合网| 欧美日韩怡红院| 国产福利a级| 国产一区二区三区福利| 影音先锋在线播放| 制服诱惑亚洲| 国产成人精品亚洲线观看| 成人久久一区| 性色av一区二区怡红| 国产一区亚洲一区| 国产色91在线| 欧美日韩精品在线观看| 日韩免费看网站| 色老头一区二区三区| 欧美在线不卡区| 2019国产精品视频| 欧美日韩一区二 | 欧美黑人一区二区三区| 国产精品va在线播放| 国产美女99p| 男人添女荫道口喷水视频| 成人免费观看在线网址| 国产高清视频在线观看| 超碰一区二区| 欧美三级午夜理伦三级小说| 欧美日韩一卡| 国产成人综合亚洲网站| 国产精品久久久久久久久搜平片 | 国产精品永久入口久久久| 国产精品99久久久久久大便| 国产精品免费观看久久| 污视频在线观看免费| 福利在线免费视频| 少妇高潮一区二区三区| 国产精品一区毛片| 久久精品一区二区三区不卡| 色妞www精品视频| 在线观看亚洲视频| 国产欧美一区二区三区在线| 亚洲午夜久久久影院伊人| 中文字幕www| www.久久ai| 久久精品国产亚洲5555| 国产亚洲毛片| 久久精品夜夜夜夜久久| 欧美亚洲国产一区二区三区va| 最近2019中文字幕一页二页| 成人网欧美在线视频| 欧美这里只有精品| 伊人永久在线| 欧美a一级片| 亚洲无线一线二线三线区别av| 99re这里只有精品首页| 欧美视频中文字幕| 欧美精品久久久久久久免费观看 | 操你啦在线视频| 日本一区二区三区电影免费观看| 一区在线免费观看| 国产肉丝袜一区二区| 538在线一区二区精品国产| 久久久免费观看| 日本在线高清视频一区| 成人影院一区二区三区| 国产精品xx| 久久久五月天| 久久久久久久久久久黄色| 日韩欧美色综合网站| 国产精品白嫩初高中害羞小美女| 日韩a级黄色片| 麻豆视频免费在线观看|