国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

近兩百萬人圍觀的Karpathy年終大語言模型清單,主角是它們

人工智能 新聞
對于人工智能領域而言,2025 年是大語言模型(LLM)快速演進、重磅事件密集出現的一年。

2025 年還有 10 天就要結束,這意味著是時候進行一波年終總結了。

對于人工智能領域而言,2025 年是大語言模型(LLM)快速演進、重磅事件密集出現的一年。

就在昨天,知名 AI 學者 Karpathy 列出了一份清單,記錄了他個人認為最重要、也多少有些出乎意料的「范式轉變」。

這些真正改變了行業格局、并在概念層面讓 Karpathy 印象深刻的變化會落在哪些領域呢?我們接下來一一來看(以第一人稱)。

可驗證獎勵強化學習(RLVR)

2025 年初,幾乎所有實驗室的 LLM 生產訓練流程都像下面這樣:

  • 預訓練(類似 2020 年的 GPT-2/3);
  • 監督微調(SFT,類似 2022 年的 InstructGPT)
  • 基于人類反饋的強化學習(RLHF,約 2022 年)

這套流程穩定、可靠,曾長期被視為「工業級 LLM」的標準做法。

但在 2025 年,一種新的階段浮出水面,并迅速成為事實上的標配:可驗證獎勵強化學習(Reinforcement Learning from Verifiable Rewards,RLVR)。

RLVR 的核心做法是,讓模型在可自動驗證的環境中接受強化學習訓練,比如數學題、代碼題、邏輯謎題等。在這些環境中,模型自發學會一些在人類看來非常像「推理」的策略:它會把復雜問題拆解成中間步驟,并反復試探、修正路徑,逐步逼近答案(DeepSeek R1 的論文中有不少很好的例子)。

在以往的 SFT 或 RLHF 框架下,這類「推理軌跡」是極難人為設計出來的。這是因為我們并不知道對模型而言,什么才是「最優的思考過程」。而在 RLVR 中,模型可以通過優化獎勵函數,自行摸索出對自己最有效的解題方式。

此外,與 SFT 和 RLHF 這種「計算量相對較小的薄層微調」不同,RLVR 使用的是客觀、難以被投機取巧的獎勵函數,這使得訓練可以跑得非常久。結果就是:RLVR 提供了極高的能力 / 成本比,大量吞噬了原本準備用于預訓練的算力。

因此,2025 年的大部分能力提升,并不是來自模型規模的暴漲,而是來自相似規模模型 + 更長時間的 RL 訓練。這個階段還帶來了一個全新的「旋鈕」:通過在推理時生成更長的思考鏈條、投入更多測試時算力,模型能力可以繼續提升,并呈現出新的 scaling law。

OpenAI 的 o1(2024 年底)是第一個明確展示 RLVR 思路的模型,而 2025 年初的 o3,則是那個讓人直觀感受到質變拐點的版本。

幽靈 vs 動物:鋸齒狀智能

2025 年,是我(以及我認為整個行業)第一次真正直覺性地理解了 LLM 智能的「形狀」。我們并不是在「培育或進化動物」,而是在「召喚幽靈」。

LLM 的一切都和人類不同:神經結構不同、訓練數據不同、訓練算法不同,最關鍵的是優化目標完全不同。人類神經系統,是為叢林生存、部落協作而優化的;而 LLM 是為模仿人類文本、在數學謎題中拿分、在 LM Arena 里獲得點贊而優化的。

一旦某些領域具備可驗證性,RLVR 就會在這些區域「長出尖刺」。于是我們看到的,是一種鋸齒化(jagged)明顯的能力分布:它們可以在某些領域表現得像博學的天才,同時又在另一些地方像困惑的小學生,甚至輕易被 jailbreak 套走隱私數據。

我很喜歡一張 meme:人類智能是藍色曲線,AI 是紅色曲線。它也提醒我們:人類智能本身,同樣是鋸齒狀的,只是形狀不同。

這也解釋了我在 2025 年對基準普遍不當回事與不信任。問題在于:基準測試本質上就是可驗證環境,因此天然容易被 RLVR 或弱化版本的「合成數據訓練」所攻破。

在現實中,模型團隊往往會在基準所在的嵌入空間附近「培育能力突起」,把 jaggies 精準地長到測試點上。「在測試集上訓練」已經演變成了一門藝術。

那么問題來了:如果一個模型碾壓了所有基準,卻依然不是 AGI,那意味著什么?

Cursor:LLM 應用的新一層

Cursor 在 2025 年的爆發本身就很驚人,但對我而言,更重要的是:它清晰地揭示了一種全新的 LLM 應用層。

人們開始說,「這是某某領域的 Cursor」。在我今年 YC 演講中提到過:像 Cursor 這樣的 LLM 應用,本質是在為特定垂直領域打包和編排 LLM 能力:

  • 上下文工程(context engineering);
  • 在后臺編排多次 LLM 調用,形成越來越復雜的 DAG,同時平衡成本與性能;
  • 提供面向人的、領域專用的 GUI;
  • 提供「自主性滑塊」(autonomy slider)。

2025 年圍繞著一個問題出現了大量討論:這一層會有多厚?LLM 實驗室會不會吞掉所有應用?還是說,LLM 應用層依然有廣闊空間?

我個人的判斷是:基礎模型會趨向于「一個通用能力很強的大學畢業生」,而真正把他們組織成專業團隊、在具體行業中落地的會是應用層,通過私有數據、傳感器、執行器和反饋回路將模型組織并投入實際工作流程」。

Claude Code:住在你電腦里的 AI

Claude Code(CC)是我第一次覺得:「這才像一個真正的 LLM Agent。」它以循環方式將推理與工具調用串聯起來,能持續解決長任務。

更重要的是:它運行在你的本地電腦上,直接使用你的環境、數據和上下文。

我認為 OpenAI 在這里判斷失誤了:他們把 agent /codex 的重心放在云端容器、由 ChatGPT 統一調度;而在一個能力鋸齒、起飛緩慢的世界里,更合理的順序其實是先讓 agent 成為開發者身邊的伙伴。

Claude Code 在這點上做對了,并且用一個極其優雅、極簡、極具說服力的 CLI 形態呈現出來。

AI 不再只是一個你訪問的網站,而是一個住在你電腦里的小幽靈。

這是一次全新的交互范式轉變。

Vibe Coding(氛圍編程)

2025 年,是 AI 跨過某個關鍵門檻的一年:人們可以只用英語構建復雜程序,甚至忘記代碼本身的存在。

有趣的是,「vibe coding」這個詞,最早只是我一條隨手寫的推文,完全沒想到會流傳這么廣。

Vibe coding 讓編程不再只是專業工程師的專利,任何人都可以上手;但同時,它也讓專業工程師可以寫出大量原本永遠不會被寫出來的軟件。

在 nanochat 項目中,我直接用 vibe coding 寫了一個高效的 Rust BPE tokenizer;我用它快速寫了很多 demo 項目(比如 menugen、llm-council、reader3、HN time capsule);甚至為了定位一個 bug,我會 vibe coding 一個臨時應用,用完即棄。

代碼變得不值錢、短暫存在、并可隨意改寫與丟棄。

Vibe coding 在重塑軟件形態之外,也會重塑工作角色。

Nano Banana:LLM 的 GUI

Google Gemini 的「Nano Banana」,是 2025 年最讓我震撼的模型之一。

在我的世界觀里,LLM 是類似 1970–80 年代計算機的新一代通用計算范式,因此我們必然會看到類似的演化路徑:

  • 個人計算
  • 微控制器(認知核心)
  • Agent 網絡(類似互聯網)

而在 UI/UX 層面,「聊天」就像 80 年代的命令行。文本是計算機最偏好的表示形式,但并不是人類最喜歡的輸入方式。人們更喜歡視覺化、空間化的信息 —— 這正是 GUI 出現的原因。

同理,LLM 也應該用我們偏好的形式與我們交流:圖片、信息圖、幻燈片、白板、動畫、網頁應用……

Emoji 和 Markdown 只是最早期、最粗糙的嘗試。那么,誰會構建真正的 LLM GUI?在我看來,Nano Banana 是一個非常早期但重要的信號。

它的意義不只在于圖像生成,而在于:文本、圖像與世界知識在同一模型中深度糾纏。

最后總結

2025 年,是一個令人興奮、也充滿意外的大模型之年。

LLM 正在顯現出一種全新的智能形態:它們既比我預期的聰明得多,又比我預期的愚蠢得多。

但無論如何,它們已經極其有用,而我認為行業甚至還沒有發揮出它們 10% 的潛力。

想法太多,空間太大,這個領域仍然是開放的。

正如我今年在 Dwarkesh 播客中說過的那樣:

我一方面相信進展會持續且迅猛,另一方面也清楚,還有大量艱苦而細致的工作要做。

「系好安全帶」,接下來只會更快。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2012-09-07 13:32:57

IT運維人員

2025-04-22 08:58:01

2022-05-19 16:36:13

信息泄露隱私

2021-12-02 09:36:13

AI 數據人工智能

2025-10-28 08:55:06

AI模型ChatGPT

2024-09-13 06:40:32

2016-07-02 15:15:58

51CTO學院知識視頻

2023-03-21 09:44:34

模型AI

2018-09-07 22:36:20

2025-01-06 00:00:00

2024-04-17 12:51:49

2016-11-04 11:28:43

媒體 GMGC

2016-09-27 11:31:34

JavaScript編程語言

2025-04-09 12:56:11

AI視頻生成

2023-09-06 12:11:21

ChatGPT語言模型

2019-12-05 10:53:50

WindowsWindows PC操作系統

2022-12-02 15:19:16

深度學習算法

2023-09-01 14:32:27

語言大語言模型

2023-11-24 14:05:00

AI訓練
點贊
收藏

51CTO技術棧公眾號

一本色道久久| 精品人在线二区三区| 色婷婷久久久亚洲一区二区三区 | 男人天堂久久| 欧洲色大大久久| 亚洲综合自拍一区| 香蕉久久精品日日躁夜夜躁| 国产精品日日摸夜夜摸av| 一区二区三区四区国产| 日韩午夜高潮| 亚洲综合小说区| 久久久久久久91| 国产成人午夜99999| 欧美久久久久久蜜桃| 免费av网址在线| 国产精品成人一区二区三区| 一区二区三区免费网站| xxxxx成人.com| 在线欧美小视频| 91久久国产婷婷一区二区| 欧洲精品一区二区三区| 国产亚洲永久域名| 成人福利网站在线观看11| 成人精品中文字幕| 国产精品视频精品视频| 久久综合之合合综合久久| 色哟哟一区二区在线观看 | 欧美综合二区| 日韩第一页在线| 乱插在线www| 精品一区二区三区电影| v888av成人| 国产精品看片你懂得 | 26uuu久久天堂性欧美| 亚洲视频在线观看一区二区三区| 国产亚洲美州欧州综合国| 成人亚洲在线观看| 亚洲国产一区二区视频| 天堂资源在线中文| 日韩av最新在线| 蜜桃精品视频| 国产视频观看一区| 久久精品123| 国产成人永久免费视频| 久久你懂得1024| 成人性生交大片免费看视频直播| 综合精品一区| 日韩亚洲视频在线| 91网上在线视频| 免费成年网站| 久久国产婷婷国产香蕉| 国产精品久久婷婷六月丁香| 亚欧美无遮挡hd高清在线视频 | 国产亚洲精品aa午夜观看| 精品视频免费在线播放| 国产欧美一区二区三区鸳鸯浴 | 国产综合久久| av动漫免费观看| 久久综合丝袜日本网| 69国产精品视频| 污视频网站在线免费| 国产欧美一区二区三区久久| 香蕉久久夜色精品国产更新时间| 久久久久久久999精品视频| 日韩高清二区| 国产精品白丝jk黑袜喷水| av7777777| 国产精品乱人伦中文| 国产66精品久久久久999小说| 国产精品青草综合久久久久99| 欧美jiizzhd精品欧美| 不卡av在线网| www.色就是色| 欧美日韩精品一区二区视频| 免费看污久久久| 成人国产精品免费网站| 色琪琪原网站亚洲香蕉| 午夜欧美一区二区三区在线播放| 欧美日本网站| 国产视频精品va久久久久久| 国产一区二区三区四区五区传媒 | 日本欧美国产| 亚洲精品久久久久久国产精华液| 日p在线观看| 韩国理伦片一区二区三区在线播放| 欧美一区二区国产| 欧美日韩一区二| 一区二区三区 在线观看视频| 一区二区三区中文免费| 欧美色图婷婷| 国内精品小视频在线观看| 香蕉成人久久| 天天想你在线观看完整版电影免费| 91精品国产一区二区三区| youjizzjizz亚洲| 色婷婷久久综合| 亚洲精品国产精品粉嫩| 4438x成人网全国最大| 久久久精品免费视频| 免费看美女视频在线网站| 日韩在线视频网站| 久草在线中文最新视频| 成人亚洲综合色就1024| 中文字幕免费一区二区| 国产亚洲成av人片在线观黄桃| 国产精品69av| 成人激情自拍| 午夜在线视频免费观看| 在线看不卡av| 精品在线手机视频| 日韩免费在线播放| 日韩—二三区免费观看av| 亚洲老女人视频免费| 欧美视频第三页| 狂野欧美激情性xxxx欧美| 奇米四色中文综合久久| 全球av集中精品导航福利| 韩国无码av片在线观看网站| 国产伦精品一区二区三区免费| 九色在线播放| 国产精品旅馆在线| 亚洲欧洲精品一区二区三区| 永久免费观看精品视频| 丁香色欲久久久久久综合网| 亚洲精品一线二线三线| 久久成人在线| 国产精品久久久久久福利| 在线免费观看日韩欧美| 在线观看美女网站大全免费| www.精品在线| 亚洲欧美久久| 免费国产在线视频| 午夜精品久久久久久久99热浪潮| 午夜电影久久久| 老司机一区二区三区| 狠狠色一日本高清视频| 欧美激情在线免费| 性欧美videoshd高清| 国产精品无av码在线观看| 中文字幕一区视频| 日韩亚洲一区在线播放| 国产 日韩 欧美一区| 亚洲一级在线| 国色天香久久精品国产一区| 91麻豆免费在线视频| 女人扒开屁股爽桶30分钟| www.日韩欧美| 在线看视频你懂得| 国产精品黄色av| 一级特黄大欧美久久久| 欧美日韩激情在线一区二区三区| 91精品国产高清一区二区三区| 欧美一区二区视频在线观看 | 成人欧美一区二区三区黑人免费| 欧美三级电影网| 国产成人亚洲精品青草天美 | 噜噜噜躁狠狠躁狠狠精品视频| 一级毛片视频在线观看| 久久综合狠狠综合久久综青草 | 美国成人av| 国内精品久久国产| 日韩欧美激情在线| 国产一区二区日韩精品| 粉嫩av国产一区二区三区| 羞羞在线观看网站| 91久久在线观看| 91精品欧美综合在线观看最新| 久久精品国产亚洲高清剧情介绍| 精品网站在线| 国产亚洲欧洲黄色| 99热这里都是精品| 每日更新在线观看av| 鲁片一区二区三区| 国产亚洲欧洲在线| 一区二区中文视频| 亚洲人www| 免费高清成人| 亚洲aaaaaa| 亚洲美女av网站| 91精品福利| 国产丝袜精品丝袜| 已婚少妇美妙人妻系列| 成人在线中文字幕| 亚洲精品suv精品一区二区| 久久众筹精品私拍模特| 68国产成人综合久久精品| 视频在线观看入口黄最新永久免费国产 | 猫咪在线永久网站| 亚洲第一页在线视频| 欧美在线视频一区二区| 69成人精品免费视频| 国产无一区二区| 麻豆精品网站| 亚洲裸色大胆大尺寸艺术写真| 激情av在线播放| 欧美xxxx18| 欧美性受黑人性爽| 91嫩草在线| 国内精品伊人久久| 亚洲精品天天看|