2025最大AI贏家的凡爾賽年度總結,哈薩比斯Jeff Dean聯手執筆
如何回顧2025年的AI進展?
今年王者歸來的谷歌,剛剛由Jeff Dean和哈薩比斯牽頭,完成了年度總結和趨勢展望報告——
這是AI Agent、推理和科學發現的一年。
報告最后梳理出了八大研究方向,系統性地回答了一個更重要的問題:
當大模型進入推理時代,AI 正在變成什么?
從Gemini的推理能力、多模態理解,到Agent、機器人、科學研究和物理世界建模,谷歌正在描繪一個可以協作、可以行動、甚至開始參與科學發現的智能系統。
模型的推理、多模態理解、生成能力及效率得到顯著提升。
AI已廣泛融入谷歌的主要產品中。
2025年創造性AI工具全面提升。
AI在科學和數學領域實現多項成果,尤其是數學和編程競賽表現優異。
谷歌始終強調安全、責任與合作開放生態。

以下是量子位的原文總結,在不改變原意的基礎上,進行了適當修改潤色:
谷歌年度回顧全文
回顧2025年,這是研究領域取得非凡進展的一年。
在人工智能方面,可以清晰地看到其發展軌跡正從一種工具轉變為一種實用手段:從人們使用的東西變成了可以投入工作使用的東西。
如果說2024年是為這個時代奠定多模態基礎的一年,那么2025年就是人工智能開始真正與人類一同思考、行動和探索世界的一年。
在量子計算領域,谷歌也在邁向實際應用方面取得了進展。
概括來講,在各個領域,谷歌都正在助力將研究轉化為現實,讓功能更強大、更實用的產品和工具對人們的生活產生積極影響。
基礎模型能力突破
首先今年,谷歌在推理、多模態理解、模型效率和生成能力方面均取得了突破性進展,顯著提升了模型性能。
這一系列進展始于3月份發布的Gemini 2.5,一直到在11月推出了Gemini 3,并于12月推出了Gemini 3 Flash。
基于最先進的推理技術,Gemini 3 Pro是谷歌迄今為止最強大的模型,旨在幫助用戶將想法變為現實。
它在LMArena排行榜上位于榜首,并憑借在人類終極考試以及GPQA Diamond等基準測試中的突破性分數,重新定義了多模態推理。
它還為數學領域的前沿模型樹立了新標準,在MathArena Apex上創下了23.4%的最新紀錄。
隨后,谷歌推出了Gemini 3 Flash,它融合了Gemini 3的專業級推理能力與Flash級別的延遲、效率和成本優勢,使其成為同尺寸下性能最佳的模型。
Gemini 3 Flash的質量超越了谷歌之前的Gemini 2.5 Pro規模模型的能力,價格卻只有它的一小部分,且延遲顯著降低,延續了Gemini時代的趨勢——
下一代的Flash模型優于上一代的Pro模型。

另外,谷歌今年也致力于通過最先進的開源模型,讓實用的AI技術變得更易于獲取。
谷歌的Gemma系列模型不僅具有輕量級特性,而且開源。在今年,還成功引入了多模態能力,大幅度增加了上下文窗口,拓展了多語言功能,并提升了效率和性能。
AI產品的深度集成與創新
2025年,谷歌繼續推動AI從工具轉向實用工具,憑借全新、強大的Agent能力改造現有的產品組合。
谷歌重新構想了軟件開發,不再局限于輔助編碼工具,而是引入能與開發者協作的強大Agent系統,比如Gemini 3高超的編碼能力以及Google Antigravity的推出,都標志著AI輔助軟件開發邁入了一個新時代。

這一演變同樣也在谷歌的核心產品中清晰可見,從Pixel 10上的AI功能、搜索中AI模式的更新,到類似Gemini應用和NotebookLM這類的AI創新產品,而這些產品均增加了深度研究等高級功能。
AI賦能創造力
2025年也是生成式媒體變革的一年,AI為創意提供了全新且前所未有的能力。
用于視頻、圖像、音頻和虛擬世界的生成式媒體模型及工具變得更加高效,應用也更為廣泛,其中突破性的Nano Banana和Nano Banana Pro在原生圖像生成與編輯方面展現出了前所未有的能力。
谷歌還與創意行業人士合作,開發了Flow和Music AI Sandbox等工具,讓它們能更好地輔助創意工作流程。
同時,谷歌通過谷歌藝術與文化實驗室推出全新的AI驅動體驗、對Gemini應用中的圖像編輯功能進行了重大升級,以及引入Veo 3.1、Imagen 4和Flow等強大的新型生成式媒體模型,為人們拓展了創意可能性。

今年谷歌實驗室也進行了一些極具吸引力的實驗,包括:
- Pomelli:AI用于品牌營銷內容;
- Stitch:能在幾分鐘內將提示詞和圖像輸入轉化為復雜用戶界面設計和前端代碼;
- Jules:異步編碼Agent,可作為開發者的協作伙伴;
- Google Beam:3D視頻通信平臺,利用AI拓展了遠程在場的可能性。
推動科學與數學發展
2025年也是AI科學進步的標志性一年,生命科學、健康、自然科學和數學領域均在AI幫助下取得了諸多進展。
這一年里,谷歌在構建AI資源和工具方面取得了進展,這些資源和工具為研究人員賦能,幫助他們在醫療健康領域理解、識別和開發新的治療手段。
在基因組學領域,谷歌已將先進技術應用于研究長達十余年,如今谷歌超越了測序階段,正在利用AI來解讀最復雜的數據。
谷歌在今年也紀念了AlphaFold問世的第五周年,這一榮獲諾貝爾獎的AI系統解決了困擾學界50年的蛋白質折疊問題。目前它已被190多個國家的300多萬名研究人員使用。
而Gemini的高級思考能力,包括Deep Think,也在數學和編程領域取得了歷史性進展。
Deep Think已經能夠理解需要深度抽象推理的問題,并在兩項國際競賽中達到了金牌水平。
推進計算和物理世界研究
谷歌今年在量子計算、能源和突破性技術等領域也取得了重大發現,并吸引了前所未有的關注。
其中量子計算在現實世界應用方面的進展尤為顯著,例如Quantum Echoes項目。
值得一提的是,谷歌員工Michel Devoret與前谷歌員工John Martinis以及UC伯克利的John Clarke共同獲得了2025年諾貝爾物理學獎,以表彰他們在20世紀80年代的基礎量子研究。
2025年,谷歌繼續推進為AI提供動力的核心基礎設施,重點關注硬件設計的突破和能源效率的提升,包括推出Ironwood,一款為推理時代打造的新型TPU,它是采用名為AlphaChip的方法設計的,同時谷歌還致力于衡量技術對環境的影響。

谷歌在機器人技術和視覺理解方面的研究,也將AI Agent帶入了物理世界和虛擬世界,比如基礎性的Gemini Robotics模型、更先進的Gemini Robotics 1.5,以及Genie 3的推出,其中Genie 3成為了通用世界模型的新前沿。

應對全球性挑戰與機遇
谷歌今年的工作直觀展示了AI驅動的科學進步,如何直接應用于解決世界上最關鍵和普遍存在的挑戰。
通過利用最先進的基礎模型和Agent推理,谷歌極大地加深了對地球及其系統的理解,同時在氣候韌性、公共衛生和教育等領域提供了影響力解決方案。
例如,谷歌正利用最先進的基礎模型和代理推理來幫助加深對地球的理解,涵蓋天氣預報、城市規劃、公共衛生等多個領域。例如,谷歌的洪水預報信息目前已覆蓋全球150個國家超20億人口。
而谷歌最先進、最高效的預報模型WeatherNext 2,生成預報的速度能快8倍,且分辨率可達1小時。借助這項技術,谷歌通過實驗性的氣旋預測,支持氣象機構做出有效決策。

谷歌也正在與合作伙伴攜手,將AI驅動的科學進展更貼近患者,為疾病管理和療法研發開辟新途徑。
此外,AI正被證明是教育領域的一個強大工具,通過LearnLM和Gemini中的引導式學習,它能促成新的理解形式并激發學生更多好奇心。
谷歌今年將Gemini最強大的翻譯能力引入谷歌翻譯,使其能提供更智能、更自然且更準確的翻譯,并試點了新的語音互譯功能。
重視責任與安全
谷歌將研究突破與責任和安全相結合。
隨著模型能力不斷增強,谷歌正持續改進和發展旗下的工具、資源及安全框架,以預測并降低風險。
Gemini 3就切實展現了這種觀念:它是谷歌迄今為止最安全的模型,并且經過了最全面的安全評估。
此外,谷歌還在展望更長遠的未來,探索通往AGI的負責任之路,將準備工作、主動風險評估以及與更廣泛的人工智能社區合作置于優先地位。
提供跨界合作與開放生態
谷歌認為,要負責任地推進人工智能的前沿領域,需要全社會各方面的協作。
2025年,谷歌與頂尖的人工智能實驗室合作,成立了Agentic AI基金會,并支持開放標準,以確保Agentic AI擁有一個負責任且具備互操作性的未來。
在教育領域,谷歌也與教育機構合作,幫助學生掌握AI技能。并與加州大學伯克利分校、耶魯大學、芝加哥大學等眾多高校研究合作,一起推動前沿研究。
此外,谷歌正與多個實驗室合作,協同改變科學研究的開展方式。與電影制作人和其他創意開發者合作,為他們提供最優質的AI工具,探索人工智能時代的新的敘事方式。
2026年,谷歌希望能夠繼續安全且負責任地推進前沿技術,為人類謀福祉。


































