哈薩比斯:DeepMind才是Scaling Law發(fā)現(xiàn)者,現(xiàn)在也沒看到瓶頸
Scaling Laws不死!
前有l(wèi)lya暴論Scaling遇到瓶頸,后腳哈薩比斯就隔空力挺Scaling Law:
Scaling有用,而且AGI必須用。

u1s1,哈薩比斯說這話,有理有據(jù)。
且看今年硅谷哪家贏得盆滿缽滿,毫無疑問非谷歌莫屬。
剛剛靠Scaling Law打了場(chǎng)漂亮的翻身仗,谷歌Gemini 3全網(wǎng)爆火就是最好的驗(yàn)證。

除此之外,在這場(chǎng)Axios AI+峰會(huì)上,他還透露了有關(guān)Scaling Law的更多細(xì)節(jié),以及對(duì)未來12個(gè)月AI的發(fā)展預(yù)測(cè):
Scaling Law最早的發(fā)現(xiàn)者不是OpenAI,是DeepMind。
單靠Scaling Law,也有可能達(dá)成AGI。
明年世界模型依舊重中之重。
Gemini的未來是通用萬能助手。
結(jié)果顯而易見,他的這番“逆風(fēng)”發(fā)言在??上引發(fā)了兩極分化的討論。
有人支持他對(duì)Scaling Law許下的美好愿景:Scaling還能再撐五百年(doge)

也有人認(rèn)為Scaling Law不是長(zhǎng)遠(yuǎn)之計(jì)……

不過說歸說,哈薩比斯這場(chǎng)訪談還是有很多可取之處,下面123開學(xué)走起:
Scaling在實(shí)現(xiàn)AGI上的關(guān)鍵作用
有趣的是,往前追溯Scaling Law的歷史,公認(rèn)開山立派的是2020年的OpenAI,轉(zhuǎn)折則出自2022年的谷歌DeepMind。
哈薩比斯這次卻給出了另一個(gè)視角,或許能解釋為什么谷歌DeepMind始終堅(jiān)持Scaling Law路線。
事實(shí)上,Scaling Law最早是由我們的團(tuán)隊(duì)發(fā)現(xiàn)的。
不過那時(shí),Scaling Law還不叫這個(gè)名字,它在內(nèi)部被稱為“Chinchilla Scaling Laws”。

該發(fā)現(xiàn)源自于DeepMind在2017年至2018年期間對(duì)大語言模型的研究,不過那時(shí)它們并沒有被公開發(fā)布,而是作為內(nèi)部資料進(jìn)行使用。
Scaling Law的有效性引起了DeepMind的注意,于是他們開始調(diào)整研究方向,將更多的資源投入其中。
而這一決策也促使DeepMind在大模型領(lǐng)域取得了空前的成功,從Gemini的1.0到如今的3.0時(shí)代,可以說谷歌用工程化極致詮釋了什么是Scaling Law。
所以對(duì)于AGI的終極幻想,谷歌DeepMind仍然堅(jiān)定認(rèn)為,Scaling Law必不可少。

首先無論最終的AGI呈現(xiàn)出何種形態(tài),Scaling都會(huì)是其中的關(guān)鍵組成部分。
就當(dāng)下而言,Scaling并沒有完全到達(dá)極限,繼續(xù)沿著該路線將系統(tǒng)推向最大化,是必要的過程。
甚至夸張一點(diǎn)講,Scaling甚至可以是整個(gè)AGI系統(tǒng)。
AGI作為一種仍處于理論階段的AI版本,要展現(xiàn)出類人的智慧能力,Scaling Law的大量數(shù)據(jù)和計(jì)算資源的投入,無疑是一種合理的解決途徑。
不過哈薩比斯也猜測(cè),除了Scaling Law,AGI還需要一兩個(gè)類似Transformer或AlphaGo級(jí)別的的重大突破。

而這個(gè)時(shí)間也不會(huì)太久,哈薩比斯說:
Maybe 5到10年。
展望未來12個(gè)月后的AI
至于12個(gè)月后,人工智能會(huì)發(fā)展到何等程度,哈薩比斯強(qiáng)調(diào)了以下幾個(gè)觀點(diǎn):
1、完整的多模態(tài)融合。
這是目前谷歌DeepMind正在全力推進(jìn)的方向。
從基礎(chǔ)模型Gemini開始,就主打多模態(tài)定位,可以無縫處理圖像、視頻、文本和音頻,并生成相應(yīng)類型的輸出。
這類交叉融合將在接下來一年里,繼續(xù)成為主流AI模型的演進(jìn)方向,以全面提升模型的推理和創(chuàng)造力。
2、視覺智能的突破。
以谷歌最新的Nano Banana Pro舉例,這類圖像模型展示了對(duì)視覺的驚人理解,可以創(chuàng)建出高度精準(zhǔn)的信息圖表。
所以在這一點(diǎn)上,還有值得繼續(xù)探索的空間,比如解鎖更豐富的分析、故事講述和分步視覺推理。

3、世界模型的普及。
今年以來,大牛們紛紛開始押注世界模型。
從李飛飛公測(cè)世界模型Marble、LeCun離職創(chuàng)業(yè)世界模型……哈薩比斯也在采訪中表示,世界模型也是他個(gè)人目前的工作重點(diǎn)之一。
8月份谷歌上線的世界模型Genie 3,可以讓用戶生成一段交互式視頻,然后像在游戲里一樣在視頻中自由走動(dòng),并保持長(zhǎng)達(dá)一分鐘的連貫性。
所以下一年,世界模型依舊會(huì)飽受業(yè)界關(guān)注。
4、Agent變得可靠。
坦白來說,現(xiàn)有的Agent系統(tǒng)還并不完全可靠,無法將任務(wù)完全交付它們。
但哈薩比斯認(rèn)為,再有一年時(shí)間,Agent將改變這個(gè)局面,開始接近于可靠地完成委托任務(wù)。
至于Gemini,他們對(duì)其設(shè)定的最終目標(biāo)是——成為通用助手。

現(xiàn)在的Gemini 3,獨(dú)到之處在于其個(gè)性化的深度。
回答簡(jiǎn)潔,且能夠溫和地反駁不合理的觀點(diǎn),能讓用戶切實(shí)感受到模型在智能和實(shí)用性上有了質(zhì)的飛躍。
另外讓哈薩比斯感到驚喜的是,Gemini 3可以用于一鍵式生成商業(yè)級(jí)游戲,而且只需要幾個(gè)小時(shí)。
這展現(xiàn)出了Gemini 3在除Scaling Law之外,基座架構(gòu)的優(yōu)勢(shì):能夠理解高層次指令并輸出高精度細(xì)節(jié)。
所以下一代Gemini將會(huì)繼續(xù)延續(xù)Gemini 3的優(yōu)勢(shì),不僅會(huì)出現(xiàn)在更多設(shè)備上(如眼鏡、手機(jī)等),還會(huì)無縫融入人們?nèi)粘I畹囊徊糠郑苍S是提高工作效率,也可以是改善個(gè)人生活品質(zhì)。
總之,使用Gemini的頻率,將變得和使用手機(jī)一樣頻繁。




































