国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

推理大模型1年內(nèi)就會撞墻,性能無法再擴(kuò)展幾個數(shù)量級 | FrontierMath團(tuán)隊最新研究

人工智能 新聞
如果推理模型保持「每3-5個月都以10倍速度增長」,那么推理訓(xùn)練所需的算力可能會大幅收斂。

一年之內(nèi),大模型推理訓(xùn)練可能就會撞墻。

以上結(jié)論來自Epoch AI。

這是一個專注于人工智能研究和基準(zhǔn)測試的非營利組織,之前名動一時的FrontierMath基準(zhǔn)測試(評估AI模型數(shù)學(xué)推理能力)就出自它家。

與之伴隨而來的還有另一個消息:

如果推理模型保持「每3-5個月都以10倍速度增長」,那么推理訓(xùn)練所需的算力可能會大幅收斂。

就像DeepSeek-R1之于OpenAI o1-preview那樣。

圖片

看了這個結(jié)果,有圍觀網(wǎng)友都著急了:

既然在o3基礎(chǔ)上再scaling非常困難,那為啥咱不探索模塊化架構(gòu)或針對特定任務(wù)的專用模型呢?“效率”比“研究過剩”更重要!

圖片

推理訓(xùn)練還有scalable的空間

OpenAI的o1是推理模型的開山之作。

和o3、DeepSeek-R1等一樣,它們從傳統(tǒng)的大語言模型發(fā)展而來,在預(yù)訓(xùn)練階段使用了大量人類數(shù)據(jù)進(jìn)行訓(xùn)練,然后在強(qiáng)化學(xué)習(xí)階段(也就是所謂的第二階段),根據(jù)解題的反饋來改進(jìn)自己的推理能力。

雖然推理模型已經(jīng)成為了很多AI使用者的實用幫手,但關(guān)于推理訓(xùn)練所需算力的公開信息非常少,大概只有以下這些:

  • OpenAI表示,與o1相比,訓(xùn)練o3所需的算力提升了10倍——提升部分幾乎都花在了訓(xùn)練階段。
  • OpenAI沒有公開o1、o3的具體細(xì)節(jié),但可以從DeepSeek-R1、微軟Phi-4-reasoning、英偉達(dá)Llama-Nemotron等其它推理模型。它們所需的推理訓(xùn)練階段算力耕地,但可以根據(jù)它們進(jìn)行推演。
  • Anthropic的創(chuàng)始人兼CEO Dario Amodei曾針對推理模型有過一篇公開文章。

然后就沒有然后了……

根據(jù)現(xiàn)有的信息和資料,Epoch AI進(jìn)行了總結(jié)和分析。

首先,OpenAI公開過這樣一張圖表,上面展示了o3和o1在AIME基準(zhǔn)測試中的表現(xiàn),以及兩者在推理訓(xùn)練階段可能所需的算力的對比——

圖片

可以看到,終版o3花費的算力是o1的10倍。

Epoch AI分析道:“x軸很可能顯示的是推理訓(xùn)練所需算力而不是總算力。”

Epoch AI羅列了這一猜測的證據(jù)。

第一,初代o1耗費的算力比o3低四個數(shù)量級,其在AIME上的得分約為25%。

如果x軸表示總計算量,“不太可能呈現(xiàn)這種情況”。

第二,如果x軸表示的是所需總算力,這張圖意義就不大了。

因為這就意味著OpenAI訓(xùn)練了N個版本的o1,且預(yù)訓(xùn)練階段非常不完整。

依照Epoch AI的猜測,如果o3在推理結(jié)算花費的算力是o1的10倍,這意味著什么?

由于很多推理模型背后團(tuán)隊都學(xué)精了,并不公開訓(xùn)練方法和過程,所以只能從現(xiàn)有公開資料里去尋找答案。

比如DeepSeek-R1

Epoch AI此前估算,DeepSeek-R1推理訓(xùn)練中使用的算力約為6e23 FLOP(成本約 100 萬美元),需要生成大約 20萬億個tokens——這只有DeepSeek-V3預(yù)訓(xùn)練成本的20%。

雖然只是一種估算,但R1在各個榜單上的得分和o1非常接近,“因此可以用它來為o1所需算力設(shè)定一個baseline”。

比如英偉達(dá)的Llama-Nemotron Ultra,它在各個基準(zhǔn)上的分?jǐn)?shù)與DeepSeek-R1和o1相當(dāng)。

它是在DeepSeek-R1生成的數(shù)據(jù)上訓(xùn)練的。

公開信息顯示,Llama-Nemotron Ultra的推理階段耗時140000 H100小時,約等于1e23 FLOP。這甚至低于它的原始基礎(chǔ)模型預(yù)訓(xùn)練成本的1%。

再比如微軟的Phi-4-reasoning

它是在o3-mini生成的數(shù)據(jù)上訓(xùn)練的。

Phi-4-reasoning在推理階段規(guī)模更小,成本低于1e20 FLOP,可能是預(yù)訓(xùn)練所需算力成本的<0.01%。

值得注意的是,Llama-Nemotron和Phi-4-reasoning都在RL階段之前進(jìn)行了有監(jiān)督微調(diào)。

咱們再來看看今年1月DeepSeek-R1發(fā)布后,Anthropic的CEODario Amodei寫的一篇文章,這被視為關(guān)于現(xiàn)有推理模型所需算力規(guī)模的最后一點線索:

由于這是新范式,我們目前仍處于規(guī)模拓展的初期階段:所有參與者在第二階段投入的資金量都很少,花費從10萬美元提高到100萬美元就能帶來巨大收益。如今,各公司正迅速加快步伐,將第二階段的規(guī)模擴(kuò)大到數(shù)億乃至數(shù)十億美元。有一點必須重視,那就是我們正處于一個獨特的轉(zhuǎn)折點上。

當(dāng)然了,Amodei對非Anthropic模型所需算力的看法可能只基于自家公司內(nèi)部數(shù)據(jù)。

但可以清晰了解,截至今年1月,他認(rèn)為推理模型的訓(xùn)練成本遠(yuǎn)低于“數(shù)千萬美元”,大于1e26 FLOP。

Epoch AI總結(jié)道——

上述的預(yù)估和線索指向一個事實,那就是目前最前沿的推理模型,比如o1,甚至o3,它們的推理訓(xùn)練規(guī)模都還沒見頂,還能繼續(xù)scalable。

但1年內(nèi)可能就撞墻了

換句話說,如果推理訓(xùn)練還沒見頂,那么推理模型還是有潛力在短期內(nèi)快速實現(xiàn)能力拓展的。

這就意味著,推理模型還很能打,潛力巨大。

就像OpenAI展示出的下圖,以及DeepSeek-R1論文中的圖2一樣——模型答題準(zhǔn)確率隨著推理訓(xùn)練步驟的增加而大致呈對數(shù)線性增長。

圖片

這表明,至少在數(shù)學(xué)和編程任務(wù)上,推理模型的性能隨著推理訓(xùn)練的擴(kuò)展而增強(qiáng),就像預(yù)訓(xùn)練的scaling law一樣。

行文至此處,Epoch AI寫下這樣一段話:

如果推理階段的算力需求見頂,那么其帶來的增長率將收斂,大概是每年增長4倍。絕不會像o1推出后4個月就有了o3那樣,保持幾個月增長10倍的態(tài)勢。

因此,他得出這樣一個結(jié)論——

如果一個推理模型的訓(xùn)練階段僅比前沿推理模型低幾個(比如說少于三個)數(shù)量級,這種增長率可能在一、兩年內(nèi)減緩,甚至撞墻。

然鵝,想要擴(kuò)展推理模型并不是那么簡單的。

單單是數(shù)據(jù)不夠這一項,就可能導(dǎo)致其停滯不前。

大家也都還不清楚,除了數(shù)學(xué)、編程領(lǐng)域,推理訓(xùn)練是否能泛化到其它規(guī)律性沒那么強(qiáng)的領(lǐng)域。

但可以肯定的是,隨著推理模型的訓(xùn)練越來越成熟,所有推理模型所需的成本可能都趨同。

雖然研究成本的高低并不影響算力和性能之間的關(guān)系,但如果相關(guān)研究保持“花錢如流水”的狀態(tài),那么推理模型可能無法達(dá)到人們心中預(yù)期的最佳水平。

另一方面,即使所需算力的增長速度放緩,推理模型也可能持續(xù)進(jìn)化,就像R1那樣。

換句話說,不只有數(shù)據(jù)或算法創(chuàng)新能推動推理模型的進(jìn)步,算力大增也是推動推理模型進(jìn)步的關(guān)鍵因素。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-03-26 10:42:31

人工智能機(jī)器學(xué)習(xí)技術(shù)

2020-02-25 07:00:54

谷歌Android技術(shù)

2024-01-02 09:27:00

AI超算

2016-11-21 11:39:05

芯片

2025-02-12 12:45:59

2024-05-13 07:03:41

AI 模型機(jī)器學(xué)習(xí)人工智能

2020-11-04 15:30:46

神經(jīng)網(wǎng)絡(luò)訓(xùn)練標(biāo)簽

2020-09-22 15:17:59

谷歌Android技術(shù)

2023-07-10 10:15:16

2012-02-24 10:56:19

Apache更新

2023-10-07 13:16:40

ChatGPT神經(jīng)元模型

2021-04-22 12:36:20

網(wǎng)絡(luò)安全安全運維

2025-06-03 08:26:00

2025-05-27 01:27:00

LLM大模型數(shù)學(xué)推理

2025-09-29 23:26:35

DeepSeekDSAAPI

2011-07-29 08:53:07

Android平板電腦iPad

2025-01-14 13:04:08

2024-07-23 13:06:53

2025-11-07 01:33:00

AIMeta大模型
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲精品在线一区二区| 欧美日韩精品免费观看视频| 日韩美女在线观看| av网址在线免费观看| 高清国产一区二区| 成人在线视频网站| 四虎精品在线观看| 色噜噜狠狠色综合中国| 亚洲美女啪啪| 亚洲欧美中文日韩v在线观看| 特黄特色大片免费视频大全| 国产一区二区调教| 激情视频一区二区| 亚洲国产国产| 中文日韩在线观看| 在线免费看a| 91在线高清观看| 国产精品国产三级国产aⅴ中文 | 男人天堂手机在线视频| 国产视频一区三区| 中文字幕国产传媒| 亚洲视频一二区| 欧美激情图片区| 久久综合色占| 久久久亚洲天堂| 天堂资源在线中文| 亚洲最新视频在线观看| 污污软件在线观看| 国产日韩在线播放| 国产精品久久久久久久裸模| h网站在线播放| 日韩视频第一页| 日本aa在线| 日韩一区二区三区xxxx| 亚洲黄色在线| 六月激情综合网| 亚洲成人a**站| 久久国产精品露脸对白| 欧美精品一区二区三区在线四季| 国产人成在线视频| 日韩av在线免费观看| 日中文字幕在线| 亚洲精品成a人| 日韩 欧美 视频| 国产精品1区2区| 午夜神马福利影院| 久久综合久久久| 懂色av一区二区三区免费看| 九一免费在线观看| 亚洲视频综合在线| 久久国产精品视频在线观看| 亚洲1区2区3区4区| 欧美电影在线观看完整版| 成人激情视频在线| 久久噜噜亚洲综合| 久久日韩视频| 午夜天堂影视香蕉久久| 午夜影院免费在线| 亚洲色图17p| 人人狠狠综合久久亚洲婷| 久久综合入口| 日韩精品久久久久久久电影99爱| 国产精品高清网站| 久久激情网站| 91黄色小网站| 欧美日韩小视频| 9999在线精品视频| 丁香花在线影院观看在线播放| 色婷婷久久综合| 亚洲欧洲激情在线| 你懂的免费在线观看| 555www成人网| 欧美日韩一区二区免费在线观看| 黄动漫在线观看| 欧美日韩国产一区中文午夜| 黄色小视频在线观看| 日韩女优毛片在线| 97人人做人人爽香蕉精品| 91成人在线观看国产| 欧美搞黄网站| 亚洲毛片aa| 暴力调教一区二区三区| gogo高清免费视频| 欧美日韩黄色影视| 91国拍精品国产粉嫩亚洲一区| 九色精品免费永久在线| 天天做天天爱天天综合网2021 | 91免费视频观看| 久久精品网站视频| 欧美视频专区一二在线观看| 黄色免费在线观看| 色阁综合伊人av| 欧美日韩高清| 国产伦精品一区二区三区视频青涩 | av美女在线| 欧美日韩一区二区在线视频| 在线看片福利| 国产成人中文字幕| 亚洲免费成人| 成人在线观看a| 欧美日本韩国一区二区三区视频| 本网站久久精品| 91视频免费进入| 91视频在线观看免费| 69视频在线| 欧美日韩国产二区| 噜噜噜久久亚洲精品国产品小说| 国产免费一区二区三区视频| 日本高清视频一区二区| 日日夜夜亚洲| 欧美不卡三区| 玉米视频成人免费看| 色偷偷色偷偷色偷偷在线视频| 国产成人精品电影久久久| 国产一区二区电影| 欧美婷婷久久五月精品三区| 久久这里有精品| 欧美中日韩在线| 99国产精品久久久久久久成人热| 国产淫片av片久久久久久| 69堂国产成人免费视频| 欧美黑白配在线| 免费看黄色a级片| 欧美性极品少妇| 九九热线有精品视频99| 欧洲精品在线播放| 欧美一区二区在线免费观看| 国产成人影院| 91色国产在线| 亚洲最新av网址| 久久免费黄色| 国产女主播在线写真| 日本午夜人人精品| 91网站黄www| 欧美1级2级| 亚洲一区二区三区午夜| 欧美专区亚洲专区| 色综合久久网| 久久.com| 久久精品国产一区| 日韩精品视频网站| 亚洲成a人v欧美综合天堂麻豆| 视频欧美精品| 欧美中文在线| 日韩av在线一区二区三区| 国产精品社区| 理论视频在线| 国产激情视频一区| 国产精品免费av| 国产精品麻豆| 岳毛多又紧做起爽| 久久在线视频在线| 99r国产精品| 日本欧美在线| 免费国产a级片| 青青草成人在线观看| 国产精品夫妻激情| 亚洲欧美影音先锋| 久久香蕉精品香蕉| 杨幂毛片午夜性生毛片| 欧美人在线观看| 国产日韩欧美在线一区| 91九色成人| 啊啊啊国产视频| 久久久久久网站| 欧美激情中文字幕一区二区| 无人区乱码一区二区三区| 精品中文字幕av| 精品中文字幕在线2019| 久久久久久久久免费| 国产成人久久精品一区二区三区| 国产精品va无码一区二区| 日韩中文在线观看| 大白屁股一区二区视频| 日韩av黄色| 欧美日韩在线不卡视频| 久久久亚洲精选| 亚洲综合激情网| 欧美1区2区| 中文字幕资源网在线观看| 在线看无码的免费网站| 国产午夜精品全部视频在线播放| 不卡在线观看av| 色婷婷久久久| 你懂得在线网址| 综合网五月天| 久久久久久999| 欧美视频中文在线看| 亚洲一区二区免费看| 91九色porn在线资源| www污在线观看| 国内精品久久久久久影视8| 亚洲欧美日韩中文播放| 欧美.www| a∨色狠狠一区二区三区| 国产色a在线观看| 欧美不卡福利| 久久免费视频在线| 在线亚洲人成电影网站色www| 日韩不卡一区二区|