国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

半年復盤,AI迎來預訓練后的新瓶頸

發布于 2025-6-4 05:56
瀏覽
0收藏

2025年上半年結束了,AI領域持續加速。Claude 4、Gemini 2.5 Pro、OpenAI o3系列…… 編碼能力一個比一個猛,多模態應用更是遍地開花。

今天給大家分享一個半年度的復盤。這里不只有歡呼,似乎也存在一些不對勁的味道。當模型越來越寫代碼,它們的綜合能力似乎遇到了第二波瓶頸。

本文很多參考信息來源于公開信息整理,非公開信息部分不保證信息的嚴謹性。

AI按下加速鍵的上半年!

簡單概括下這半年,“卷”出了新高度 (第一部分的觀察來源于Artificial Analysis報告):

觀察一: 頭部“神仙打架”,新勢力緊追不舍

OpenAI雖強,但Google、Anthropic、xAI,還有咱國內的DeepSeek、阿里,國外的Mistral,基本上保持了2月一更的節奏。開源模型跟專有模型的智能差距也在肉眼可見地縮小,甚至DeepSeek-R1-0528有追平的趨勢。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

觀察二: 推理成本“打骨折”

高智能模型的推理成本,從去年9月到現在降了差不多32倍!達到GPT-4初版那種智能水平的成本,降了超過1000倍!

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

觀察三:  “先思考再回答”成標配

啥叫“推理模型”?就是模型在回答你之前,會先自己叨叨咕咕輸出一堆中間步驟(思維鏈)。這招確實能讓答案更準,但代價嘛,就是可能得多花10倍的Token。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

觀察四 :  智能體(Agent)和多模態“起飛”

AI自己干活的能力越來越強,什么編碼智能體、研究智能體、幫你P圖的、剪視頻的,都來了。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

多模態原生處理能力也大升級,文本、圖像、音頻一把抓,言出法隨、用嘴改圖。甚至Google Veo 3支持了原生的帶音頻的視頻輸出。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

觀察五 :  中國在AI競賽排行前列

US在推理模型上繼續處于領先地位,但是DeepSeek-v3-0324成了國人之光,引領了全球的非推理模型的性能。  (本文寫于DeepSeek-R1-0528 發布前,0528版本以接近o3性能開源,休假了暫未體驗~)

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

通用能力去哪兒了?

就在大家感慨AI寫代碼越來越6的時候,一個讓人“腦殼疼”的問題浮出水面。

因為暫未成為共識,沒有太多人探討,本文中稱之為“第二輪瓶頸”。

簡單來說,就是AI在編碼這種專業技能上突飛猛進,但在其他通用認知能力,比如復雜推理、創造性表達、細致理解這些方面,是不是有點“拉胯”了?

現象:編碼越強,其他越“菜”?

最典型的就是Anthropic的Claude 4系列。 在編碼基準SWE-Bench上那是嘎嘎亂殺,號稱“世界最好編碼模型”。但另一邊,OpenAI的o3模型在通用推理基準Humanity's Last Exam (HLE)上又領先了。這種“各領風騷”的局面,本身就很說明問題。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

紅杉最近發布了一個榜單,排在榜首的還是o3。甚至沒有Claude4的影子,反而看到了Claude 3.7 Sonnet。

半年復盤,AI迎來預訓練后的新瓶頸-AI.x社區

看到過不止一個吐槽,Claude 4 Sonnet雖然寫代碼很牛,但在文檔理解(比如OCR、手寫體識別)、世界知識和創造性寫作方面,好像有時候還不如它上一代Claude 3.7 Sonnet。這就有點尷尬了。

瓶頸的本質: 這倒不是說模型整體不進步了,而是能力圖譜可能出現了分化或者失衡,AI的畫像可能變得更尖銳了,成了個“偏科生”。

所以,一個問題來了:精通一項復雜技能(比如寫代碼),就代表AI在其他領域也能一樣牛嗎?這對AGI的實現路徑打上了一個大大的問號。

第二輪瓶頸

這“偏科”的鍋,難道要甩給 RL 階段過度使用AI編程數據(比如從cursor等編程軟件帶來的用戶實際訓練數據)嗎?

災難性遺忘 是一個在算法領域很古老的一個詞,意思是,在一個特定領域對大模型搞微調,很可能把它預訓練時學到的一般知識給覆蓋掉或者搞丟了,通用邏輯推理能力自然就受影響。

所以是否是因為用了過多的編程數據搞RL訓練,模型可能就更喜歡輸出那種結構化、邏輯化的東西,創造性、流暢性可能就下降了。

在去年,我們經歷了第一輪的AI瓶頸。

主要是因為高質量、多樣化的預訓練數據稀缺。更大規模參數的模型帶來的效果收益遞減。

在這基礎上,OpenAI的o1系列模型提出了通過測試時間推理,通過引導模型生成復雜邏輯結構(如思維鏈CoT、思維樹ToT)解決問題,無需重訓基礎模型。

在2024 Q3后的半年,“推理模型”成為主流,各家都在嘗試如何通過使用更多Token進行“思考”實現。

如何從已訓練模型中提取更多智能,更敏捷提升能力。

當前,我們面臨的更多是針對特定高級技能(如編碼)進行微調和RL所帶來的后果。

這是一個在更成熟發展階段出現的關于控制和平衡的問題。為推理/智能體技能進行的訓練,如何影響基礎模型的廣度?

本文轉載自???????探索AGI???????,作者:獼猴桃

收藏
回復
舉報
回復
相關推薦
最新在线地址| 自拍av在线| 色天天综合网| 911精品国产一区二区在线| 久久综合色视频| 美女久久久久| 亚洲欧美激情一区| 成a人片在线观看www视频| 国产亚洲成aⅴ人片在线观看| 国产不卡一区二区在线观看| 日韩一区网站| 日韩av一区二区在线| 一二三四社区在线视频| 久久精品一区四区| 在线观看日韩羞羞视频| 欧美~级网站不卡| 韩国日本不卡在线| 亚洲电影有码| 精品国产免费久久| 国产尤物视频在线| 一区二区三区中文免费| 亚洲熟妇av一区二区三区| 精品在线视频一区| 精品日本一区二区三区| 欧美系列电影免费观看| 久久久久久国产免费| 欧美一级做a| 亚洲欧美自拍一区| caoprom在线| 欧美一区二区播放| 91官网在线| 欧美在线免费观看视频| 丝袜视频国产在线播放| 亚洲在线观看免费| 免费视频二区| 亚洲欧美日韩久久精品| 成人18网址在线观看| 久久人人97超碰com| 成熟丰满熟妇高潮xxxxx视频| 国产一区二区三区高清播放| 日韩国产伦理| 久久蜜桃精品| 日本在线免费观看一区| 亚洲一区黄色| 日韩资源av在线| 六月丁香综合在线视频| 日本高清不卡三区| 蜜桃视频在线一区| 一区二区不卡视频| 国产在线视频一区| 我要色综合中文字幕| 久久久久www| 久久av网站| 欧美精品videossex88| 日韩免费成人| 欧美一级免费视频| 凹凸成人精品亚洲精品密奴| 国产欧美最新羞羞视频在线观看| 88国产精品视频一区二区三区| 91传媒视频免费| 成人av影视| 中国女人做爰视频| 老司机精品福利视频| 看高清中日韩色视频| 日韩va亚洲va欧美va久久| 中文字幕黄色大片| 成人av电影免费在线播放| 黄色免费网址大全| 亚洲午夜久久久久久久久久久| 男女网站在线观看| 精品久久久久久久久久久院品网| 99在线视频影院| 免费av网址在线| 在线观看视频免费一区二区三区| 美脚丝袜一区二区三区在线观看| 久热国产精品| 日b视频免费观看| 99久久婷婷国产综合精品| 亚洲欧洲一区| 国产精品自产拍在线观看| 狠狠色狠狠色综合日日tαg| 欧美一区2区三区4区公司二百| 经典一区二区三区| 婷婷六月天在线| 日本韩国精品在线| 亚洲精品日产| 欧亚精品中文字幕| 一区二区三区精品视频在线观看| 中文字幕乱码一区二区三区| 欧美国产综合一区二区| 成人在线二区| 久久精品国产91精品亚洲| 日韩1区2区| 熟妇熟女乱妇乱女网站| 日韩一区日韩二区| 国产在线看片| 欧美超级免费视 在线| 日韩亚洲在线视频| 中文字幕の友人北条麻妃| 在线国产亚洲欧美| 久久奇米777| 日本啊v在线| 亚洲人在线视频| 午夜精品影视国产一区在线麻豆| 免费看污久久久| 欧美激情在线观看视频免费| 黄色网页在线免费看| 欧美激情xxxxx| 99精品国产在热久久下载| 97在线播放视频| 欧美人妖巨大在线| 国产精品15p| 日韩高清av电影| 图片区日韩欧美亚洲| 99视频这里有精品| 久久影视中文粉嫩av| 一区免费观看视频| 成人美女大片| 99se婷婷在线视频观看| 91免费精品国自产拍在线不卡| 亚洲理论电影在线观看| 欧美精品国产精品日韩精品| 最近中文字幕日韩精品| 亚洲性图久久| 婷婷亚洲天堂| 日韩高清有码在线| 欧美69视频| 国产特级毛片| 美女精品视频一区| 国产精品18久久久久久久久久久久 | www.国产在线视频| 香蕉视频免费在线| 欧美一区二区三区婷婷月色| 亚洲人精品午夜射精日韩| eeuss鲁片一区二区三区在线观看| 中国黄色片免费看| 人妻久久久一区二区三区| 国产日韩欧美亚洲| 国产一区二区三区四区大秀| 欧美18—20岁hd第一次| 日韩国产精品亚洲а∨天堂免| 99久久久久国产精品| 久草在.com| 国产精品久久久久久久久久小说 | 400部精品国偷自产在线观看| 一本久道中文字幕精品亚洲嫩 | 老鸭窝毛片一区二区三区| 亚洲综合色视频在线观看| 日本精品久久久久久久久久| 一本一本久久| 国产精品精华液网站| 韩日精品中文字幕| 2024国产精品| 国产成人久久精品一区二区三区| 成人av在线播放观看| 亚洲欧美国产视频| 久久99精品久久久久久国产越南| 在线午夜影院| 亚洲aⅴ天堂av在线电影软件| 3d动漫精品啪啪| 影音先锋久久| 高潮毛片在线观看| 青青草成人激情在线| 欧美一级高清片| 久久精品久久综合| 久久久人成影片一区二区三区在哪下载 | 亚洲精品电影在线观看| 久久夜色精品| 日本大片在线播放| 欧美日韩在线不卡一区| 欧美成人激情免费网| 麻豆精品在线观看| 日韩成人亚洲| 黄色片久久久久| 日本sm极度另类视频| 天天综合天天综合色| 国产精品a级| 欧美xxxx黑人又粗又长| 日韩不卡一二区| 久久精品亚洲一区| 亚洲欧美经典视频| 欧美精品aa| 韩国精品一区| 别急慢慢来1978如如2| 亚州成人在线电影| 国精产品一区一区三区mba视频| 国产最新精品免费| 欧美喷水视频| 欧美国产激情| 99视频+国产日韩欧美| 99riav一区二区三区| 欧美在线国产| 91久久黄色| 国产精品久久久久久久久晋中 | 性欧美疯狂xxxxbbbb| 欧美性大战久久久| 亚洲加勒比久久88色综合| 亚洲人免费视频| 成人中文字幕av| 777午夜精品福利在线观看|