深夜突發!馬斯克Grok 4.1上線,算力暴漲一個數量級! 原創
每一次大模型的升級,都意味背后算力需求的又一次躍升。
?
今天凌晨,馬斯克旗下xAI正式發布了Grok 4.1模型。該版本現已向所有用戶開放,免費用戶也能在Grok官網、X平臺及iOS和Android應用中體驗到。
?

?
與之前主要追求參數規模的增長不同,Grok 4.1在算力支撐下,模型從單純規模擴張轉向綜合能力優化,特別是在推理質量、情感交互和個性化體驗方面實現了質的飛躍。
?
能力全面提升
?
Grok 4.1最顯著的進步體現在綜合性能的大幅提升。在信息查詢測試中,Grok 4.1的幻覺率從12.09%降至4.22%,幾乎是原來的三分之一,事實準確性也同步大幅提高。
?

?
這意味著用戶將能獲得更加可靠的信息服務。
?
同時,在最具權威性的盲測評估中,Grok 4.1的表現同樣令人矚目。在國際盲測平臺LMSYS Arena的最新評估中,Grok 4.1的思考模式獲得了1483的Elo評分,在所有公開可用模型中排名第一。
?

?
而其非推理模式也達到了1465 Elo,排名第二。這一成績的含金量在于,即使不啟用思維鏈推理,它的表現仍然超過了其他啟用全推理配置的模型。
?
除了“智商”,Grok 4.1的情感交互能力也有所提升。在EQ-Bench情感智力測試中,Grok 4.1取得了1586的Elo評分,比前代提高了超過100分。
?

?
這種進步使得AI助手能夠更好地理解用戶情感需求,提供更加貼心的服務。
?
算力支撐升級
?
Grok 4.1的能力飛躍背后,是算力規模的大幅提升。從Grok 4的訓練情況可以窺見這一趨勢。其訓練是在超過20萬張H100 GPU的超級計算機集群上完成的,算力規模是Grok 3時期的兩倍。
?
而且訓練策略也發生了變化,更多算力被投入到推理能力的專項訓練上。
?
這種算力投入的增長并非孤例。根據最新報告,2024年中國智能算力規模達725.3 EFLOPS,同比增長74.1%,增幅是同期通用算力增幅的3倍以上,反映出全球范圍內對AI算力的需求正在爆發式增長。
?
同時,從Grok 4的發展脈絡看,多智能體內生化已成為重要趨勢。這意味著在訓練階段就引入多智能體協作,將Agent調用及實時搜索等能力融合進模型中。
?
這種訓練方式雖然對算力要求更高,但能帶來更強大的問題解決能力。
?
隨著模型能力的提升,算力需求將持續增長。以Grok為例,相較于Grok 2,Grok 4的訓練計算量提升了整整100倍。
?
而Grok 4.1的發布,表明這種 scaling law 依然有效,擴大訓練算力對模型能力的提升依然起到至關重要作用。
?
未來,隨著各大廠商競相推出新一代大模型,算力仍將是AI競爭的核心引擎。能否獲得穩定而強大的算力支撐,已成為決定企業能否在這場馬拉松式競賽中勝出的關鍵分水嶺。
?
如果您正在進行AI領域的創業或研究,卻受困于高昂的算力成本或高并發下的推理穩定性等問題,歡迎留言或私信我們,找到您的降本增效突破口~

















