国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

剛剛,馬斯克發布Grok 4!全榜第一,年費飚到2萬+

人工智能 新聞
北京時間今天中午 12 點左右,我們期待已久的 xAI 發布會終于開始,馬斯克現身直播間,他上來就說:「這是世界上最好的 AI,讓我們來展示一下。」

所有學科都是博士后水平。

醞釀良久的 xAI 下一代大模型——Grok 4 終于發布了!能力超乎我們想象。

北京時間今天中午 12 點左右,我們期待已久的 xAI 發布會終于開始,馬斯克現身直播間,他上來就說:「這是世界上最好的 AI,讓我們來展示一下。」

馬斯克表示,Grok 4 每次都能在 SAT 考試(美國高考)中獲得滿分,無需事先查看題目,它也可以做到 GRE 任何學科接近滿分,超過了全世界所有研究生的水平。Grok 4 最強大的地方是其推理能力,它已經實現了超越人類的推理水平。

馬斯克相信,Grok 4 可以在今年內實現科學新發現。

image.png

得益于計算能力的增強、強化學習的訓練,Grok 4 的推理能力相較于前代提升了 10 倍。從 Grok 2 到 Grok 4,采用的技術范式不同,分別為下一個 token 預測、預訓練計算、預訓練 + RL、RL 計算。

其中,Grok 2 到 Grok 3 預訓練階段的計算量提升了 10 倍,Grok 3 reasoning 首次引入了 RL 微調,帶來了深度推理能力。Grok 4 reasoning 的強化學習再度提升了 10 倍的計算量,這意味著顯著的推理能力提升。

image.png

另外因為調用工具能力的提升,Grok 4 進一步放大了自身智慧。因此可以在各類高難度 Benchmark 上實現遠超 SOTA 的成績。

接下來是重頭戲:Grok 4 的基準測試結果。

首先是 HLE(Humanities Last Exam,人類最后的考試),包括數學、化學和邏輯學。在上周六泄露的基準測試結果中,Grok 4 在 HLE(Humanities Last Exam,人類最后考試)上的標準得分是 35%,使用推理技術后提高到 45%,但多數網友持質疑態度。

在今天的直播中,xAI 研究人員表示,以往的 SOTA 模型在使用工具(with tool)的情況下,成績最高可以達到 41.0%。

image.png

如今,Grok 4 進一步提升了這一基準測試成績。

image.png

具體來講,與其他 SOTA 模型(o3、Gemini 2.5 Pro)相比,在使用工具的情況下,Grok 4 的成績為 38.6%,Grok 4 Heavy 的成績飆升到了 44.4%。如果讓大模型在測試時花費更多時間思考,并恰當的使用更多外部工具,則 HLE 的分數還能進一步提升到 50.7%。

image.png

關于其他更多基準測試結果,包括 GPQA(研究生級別的 Google 驗證問答基準測試)、AIME25(美國數學競賽邀請賽)、LCB(Jan-May)(編程競賽 / 在線算法競賽)、HMMT25(高中生團隊數學競賽)和 USAMO25(美國頂級高中生數學競賽)。從下圖可以看到,Grok 4 Heavy 均取得了最新 SOTA。

相比之下,人類面對 HLE 測試也幾乎答不上幾個題。馬斯克多遍強調:Grok 現在在所有學科都達到了博士后水平,沒有例外。它沒有發現新科學或是新的物理定律,但這只是一個時間問題。

「如果 Grok 在今年內沒有發現實用的新科學技術,我會感覺很意外,」馬斯克表示。

image.png

大模型性能評估平臺 Artificial Analysis 的全套基準測試成績表明,Grok 4 已經成為當前領先的 AI 模型,總成績達到了 73 分,領先于 o3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528。

image.png

image.png

想象一下我們現在處在的位置,我們正處于智能發展的大爆炸過程中,這是人類歷史上前所未見的。是時候看看 Grok 4 具體能做些什么了。

我們來看一兩個 demo,比如「基于物理原理的 HTML 動畫,模擬兩個黑洞碰撞并產生引力波的 30 秒可視化效果」:

Grok 4 幾乎完整地呈現了從兩個黑洞接近到最后合并結束的引力波模擬效果。動圖的一邊是推理過程和計算的步驟和代碼,查閱的論文每一篇都有鏈接。

Grok 4 的多面手屬性更強了

除了各大語言基準成績的提升,Grok 4 在其他方面同樣得到了加強。

其中,Grok 4 的語音能力相較于上代速度快了 2 倍,端到端延遲更低;支持 5 種語音;單日用戶總停留時長提升了 10 倍。

image.png

新增的 Grok 角色 Eve 和 Sal 現已可在 iOS 版 Grok 中使用,Sal 支持多種性格,Eve 可以唱歌和低語。

image.png

在 ARC-AGI 基準測試集中,它專門設計用于評估人工智能系統通用推理能力,被視為通向 AGI 的重要試金石,旨在檢驗模型是否能像人類一樣靈活解決從未見過的新問題。

在這個直指 AGI 核心能力的超難基準上,Grok 4 同樣取得了最新 SOTA,其中在 ARC-AGI-2 上達到 15.9%,幾乎將之前的商業 SOTA 翻了一番,并超越了當前的 Kaggle 競賽 SOTA。

image.png

image.png

在 Vending-Bench 基準測試中,它專注于評估智能體在真實物理世界中執行復雜操作任務的能力,其核心目標是解決傳統模擬環境(如 Habitat、AI2-THOR)與真實世界間的「Sim2Real Gap」(仿真到現實的鴻溝),推動機器人技術在開放場景中的實際應用能力。

可以看到,Grok 4 相較于 Claude Opus 4、Human、Gemini 2.5 Pro、o3 取得了領先。

image.png

Grok 4 可通過 API 調用,提供 256K tokens 的上下文窗口。目前已經開放使用,版本號為 grok-4-0709,價格與 Grok 3 相同。

image.png

image.png

根據 Artificial Analysis 的測試,xAI 的 API 當前以每秒 75 個 token 的速度提供 Grok 4 服務,速度雖不及 o3(每秒 188 個 token),但優于 Claude 4 Opus Thinking(每秒 66 個 token)。

image.png

最后是游戲體驗,DannyLimanseta 在 4 小時內用 Grok 4 制作了一款 FPS 射擊游戲,Grok 不僅可以用于制作游戲,還能實際運行游戲,洞察優秀游戲的要素并提出改進建議。看著效果真的挺不錯。

下一步,xAI 預計還將發布代碼模型、多模態智能體以及視頻生成模型,看起來新產品發布要達到月更的速度。

image.png

目前,Grok 4 已經上線,不過需要付費使用,而且價格相當昂貴。其付費模式分為年付和月付兩種,其中 SuperGrok 是每年 300 美元(折合人民幣約 2154 元),SuperGrok Heavey 則是每年 3000 美元(折合人民幣 21540 元)。

image.png


  • 官網鏈接:https://grok.com/
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-18 09:11:48

2025-08-25 08:54:00

2025-02-21 10:51:47

2025-11-18 09:13:55

2023-12-13 08:46:33

人工智能ChatGPT機器人

2025-07-11 11:58:59

多智能體Grok 4AI

2025-07-25 09:25:05

2025-03-05 08:50:00

模型AI數據

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2025-09-23 09:18:40

2025-02-19 10:28:22

2025-09-19 09:10:00

2024-03-12 13:14:40

2025-08-26 09:04:00

2025-06-30 01:00:00

2024-03-29 12:48:00

數據訓練

2024-03-18 14:17:06

大模型開源人工智能

2025-02-18 14:59:16

2025-07-14 01:55:00

2025-08-07 09:20:00

點贊
收藏

51CTO技術棧公眾號

亚洲少妇中出一区| 一本色道久久88亚洲综合88| 一区在线播放| 国产精品区一区二区三区| 日韩经典一区二区三区| 欧美极品一区二区| 激情视频免费观看在线| 男人添女荫道口喷水视频| 高h视频在线观看| 亚洲一级特黄| 欧美国产日韩在线| 精品无码国模私拍视频| 51一区二区三区| 国产91在线看| 色婷婷成人综合| 国产青青在线视频| 日本高清精品| 中文乱码免费一区二区| 欧美区二区三区| 9久久婷婷国产综合精品性色| 午夜不卡一区| 久久一区二区三区国产精品| 久久精品视频导航| 91淫黄看大片| 最新国产精品精品视频| 国产精品久久久久婷婷二区次| 亚洲精品乱码久久久久久蜜桃91 | 尤物在线精品| 国产999精品久久久影片官网| 高清孕妇孕交╳╳交| 亚州av一区| 欧美性猛交xxxx富婆| 国产伦精品一区二区三区| 日本小视频在线免费观看| 麻豆国产精品一区二区三区| 亚洲精品永久免费精品| 亚洲天堂第一区| 亚洲经典视频| 久久精品精品电影网| 亚洲成人人体| 国产欧美一区在线| 成人久久久久久| 亚洲大胆人体大胆做受1| 一本久久a久久免费精品不卡| 欧美亚洲另类久久综合| 成人在线视频免费| 最新国产精品拍自在线播放| 中文字幕系列一区| 亚洲成人动漫av| 欧美大香线蕉线伊人久久国产精品| 91精品国偷自产在线电影| 精品国产髙清在线看国产毛片| 日本三日本三级少妇三级66| 精品精品视频| 天天色综合天天| 亚洲成人自拍| 蜜臀av国产精品久久久久 | 欧美精品久久久久久久久久久| 亚洲精品成人一区| 亚洲一区二区av电影| 亚洲成人av动漫| 国产在线精品不卡| 日本午夜精品理论片a级appf发布| 午夜不卡一区| 日本道色综合久久影院| av免费网站在线观看| 国产色综合一区| 日韩精品一区二区三区四区五区| 精品国产伦一区二区三区观看说明 | 日本在线看片免费人成视1000| 粉嫩绯色av一区二区在线观看| 97超碰国产精品| 日本一区二区视频在线观看| 先锋影音成人资源| 蜜臀av性久久久久蜜臀aⅴ| 国产91视频一区| 亚洲天天影视网| 久久99久久99精品中文字幕| 伦理一区二区三区| 亚洲福利视频二区| 中文字幕免费在线| av中文字幕在线不卡| 精品欧美一区二区三区久久久| 久久视频免费| 日韩免费高清在线观看| 一本色道精品久久一区二区三区 | 久久婷婷成人综合色| 午夜大尺度福利视频| 91国产免费看| 午夜伦伦电影理论片费看| 性做久久久久久| 97xxxxx| 日韩中文字幕av电影| 国产玖玖精品视频| 一区二区三区亚洲变态调教大结局| 国产精品旅馆在线| 麻豆一区二区麻豆免费观看| 亚洲jizzjizz日本少妇| 欧亚精品一区| 色婷婷综合久久久久| 久久综合色占| 欧美成人精品影院| 另类图片综合电影| 日韩小视频在线观看专区| 四虎在线视频| 亚洲精品国产a| 亚洲色成人一区二区三区小说| 美日韩一区二区| 99爱视频在线观看| 国产精品丝袜一区| 在线观看中文| 国产精品三级网站| 成人黄色一级视频| 人妻少妇精品无码专区二区 | 日韩成人高清| 日韩精品在线免费| 日韩精品午夜| 欧美综合在线观看| 精品系列免费在线观看| 女同一区二区| 免播放器亚洲| 国产一区二区三区免费不卡| 欧美有码视频| 1卡2卡3卡精品视频| 亚洲精品tv久久久久久久久久| 人人干视频在线| 欧美大胆一级视频| 成人爽a毛片免费啪啪动漫| 日韩精品一区二区三区中文精品| 大奶一区二区三区| 热久久免费视频精品| 豆国产96在线|亚洲| 国产激情小视频在线| 成人黄色短视频在线观看| 久久久精品人体av艺术| 2020色愉拍亚洲偷自拍| 亚洲美女中文字幕| av免费在线一区| 麻豆亚洲一区| 在线日韩一区二区| 黄在线免费看| 亚洲国产小视频在线观看| 粉嫩av一区| 欧美va天堂va视频va在线| 都市激情久久综合| 国产高清精品一区| 久久性天堂网| 丰满人妻一区二区三区53号| 69成人精品免费视频| 欧产日产国产精品视频| 色婷婷久久一区二区| 国产一区二区在线免费观看| 色视频在线免费观看| http;//www.99re视频| 欧美亚洲在线| 国产高清av在线| 亚洲va欧美va国产综合久久| 亚洲国产综合人成综合网站| 国产欧美日韩| 欧美日韩在线高清| 欧美日本在线一区| 99久久婷婷国产综合精品首页| 日韩精品成人一区二区在线观看| 欧美日本乱大交xxxxx| 日韩午夜激情| 欧美hdxxxxx| 美女精品视频一区| 成人av网址在线| 91成人app| 成人免费在线观看视频网站| 日本高清不卡视频| 国产一区二区三区自拍| 在线免费一区| 一区二区在线电影| 国模精品一区| 你懂的好爽在线观看| 亚洲一区二区国产| 国产一区二区观看| 一不卡在线视频| 亚洲日韩第一页| 中文字幕伦av一区二区邻居| 日本午夜视频| 中文字幕日韩av综合精品| 国产欧美日韩视频在线| 国产在线制服美女| 国产精品二区在线| 日韩欧美亚洲国产精品字幕久久久| 日韩中文字幕区一区有砖一区| 超清av在线| 97视频在线免费播放| 国产精品白嫩美女在线观看| 精品综合免费视频观看| 免费观看v片在线观看| yellow视频在线观看一区二区| 欧美在线播放高清精品| 亚洲综合网站| 中文字幕欧美一区二区| 欧美性大战久久久久| 国产一区二区三区在线观看视频| 国产精品视频一区二区三区不卡|