国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-5涌現(xiàn)能力可預(yù)測(cè)?UC伯克利僅使用當(dāng)前模型檢查點(diǎn)預(yù)測(cè)未來(lái)模型

人工智能 新聞
思維鏈提出者 Jason Wei 稱贊:「這是一篇非常聰明的論文,可以預(yù)測(cè)預(yù)訓(xùn)練模型的下游性能,非常有價(jià)值。因?yàn)榭梢允褂盟鼇?lái)預(yù)測(cè)和證明對(duì)下一個(gè)大模型訓(xùn)練運(yùn)行的資本投資的合理性。」

LLM 規(guī)模擴(kuò)展的一個(gè)根本性挑戰(zhàn)是缺乏對(duì)涌現(xiàn)能力的理解。特別是,語(yǔ)言模型預(yù)訓(xùn)練損失是高度可預(yù)測(cè)的。然而,下游能力的可預(yù)測(cè)性要差得多,有時(shí)甚至?xí)霈F(xiàn)涌現(xiàn)跳躍(emergent jump),這使得預(yù)測(cè)未來(lái)模型的能力變得具有挑戰(zhàn)性。

最近,來(lái)自加州大學(xué)伯克利分校(UC 伯克利)的研究團(tuán)隊(duì)提出涌現(xiàn)預(yù)測(cè)的任務(wù):是否可以僅通過(guò)使用 GPT-N 模型的檢查點(diǎn)(即當(dāng)前模型的狀態(tài))來(lái)預(yù)測(cè) GPT-N+1(未來(lái)模型)是否會(huì)出現(xiàn)涌現(xiàn)能力? 并在論文《Predicting Emergent Capabilities by Finetuning》中給出了答案。

圖片

  • 論文標(biāo)題:Predicting Emergent Capabilities by Finetuning
  • 論文地址:https://arxiv.org/pdf/2411.16035

值得注意的是,這篇論文的作者包括強(qiáng)化學(xué)習(xí)大牛 Sergey Levine。

該研究擬合了一個(gè)參數(shù)函數(shù) —— 涌現(xiàn)定律,模擬了涌現(xiàn)點(diǎn)如何隨數(shù)據(jù)量的變化而變化。

為了進(jìn)行驗(yàn)證,該研究使用四個(gè)標(biāo)準(zhǔn) NLP 基準(zhǔn) ——MMLU、GSM8K、CommonsenseQA 和 CoLA。通過(guò)僅使用小規(guī)模 LLM 來(lái)擬合涌現(xiàn)定律,該研究能夠準(zhǔn)確預(yù)測(cè)涌現(xiàn)點(diǎn)。

最后,該研究提出了兩個(gè)實(shí)際的涌現(xiàn)案例研究,表明該研究提出的涌現(xiàn)定律可用于預(yù)測(cè)更復(fù)雜的能力。

思維鏈提出者 Jason Wei 稱贊:「這是一篇非常聰明的論文,可以預(yù)測(cè)預(yù)訓(xùn)練模型的下游性能,非常有價(jià)值。因?yàn)榭梢允褂盟鼇?lái)預(yù)測(cè)和證明對(duì)下一個(gè)大模型訓(xùn)練運(yùn)行的資本投資的合理性。」

圖片

論文介紹

作者首先提出了涌現(xiàn)預(yù)測(cè),并將涌現(xiàn)預(yù)測(cè)定義為僅使用涌現(xiàn)前的模型檢查點(diǎn),來(lái)識(shí)別發(fā)生涌現(xiàn)的擴(kuò)展點(diǎn)的問(wèn)題。

簡(jiǎn)單理解就是,對(duì)于給定的 LLM,其在特定任務(wù)上具有隨機(jī)少樣本準(zhǔn)確率,我們能否預(yù)測(cè)這個(gè) LLM 在哪個(gè)擴(kuò)展點(diǎn)(例如,預(yù)訓(xùn)練損失)上性能將超越隨機(jī)表現(xiàn)?

帶著這一疑問(wèn),作者發(fā)現(xiàn)了這樣一個(gè)見(jiàn)解:在給定的任務(wù)上微調(diào) LLM, 可以將涌現(xiàn)發(fā)生的臨界點(diǎn)向著能力較低的模型移動(dòng) ,這意味著,通過(guò)微調(diào),模型在涌現(xiàn)能力出現(xiàn)的時(shí)間點(diǎn)可以提前,這對(duì)于理解模型擴(kuò)展和能力躍升的過(guò)程非常重要。微調(diào)所使用的數(shù)據(jù)量,會(huì)調(diào)節(jié)這種臨界點(diǎn)移動(dòng)的幅度。 

圖 3(左)繪制了每個(gè)模型在 GSM8K 和 MMLU 上的少樣本和微調(diào)性能與預(yù)訓(xùn)練損失的關(guān)系。可以看到,微調(diào)后的模型遵循與少樣本設(shè)置類(lèi)似的 ReLU 形狀。此外,在相同的預(yù)訓(xùn)練損失下,所有模型大小的轉(zhuǎn)變都是一致的,這表明預(yù)訓(xùn)練損失可以作為少樣本和微調(diào)設(shè)置中有效的獨(dú)立變量。

作者還發(fā)現(xiàn)出現(xiàn)涌現(xiàn)偏移受微調(diào)數(shù)據(jù)量的影響。圖 3(右)繪制了 3B 模型檢查點(diǎn)在完整數(shù)據(jù)子集上進(jìn)行微調(diào)后的性能。在 MMLU 和 GSM8K 上,隨著微調(diào)數(shù)據(jù)量的增加,涌現(xiàn)點(diǎn)進(jìn)一步向能力較弱的 LLM 偏移。因此,微調(diào)數(shù)據(jù)量可以調(diào)節(jié)涌現(xiàn)偏移。

圖片

為了將這一洞察付諸實(shí)踐,作者針對(duì)不同數(shù)量的數(shù)據(jù)對(duì) LLM 進(jìn)行了微調(diào),并擬合了一個(gè)參數(shù)函數(shù)(即涌現(xiàn)定律),該函數(shù)模擬了涌現(xiàn)點(diǎn)如何隨數(shù)據(jù)量的變化而變化。

圖片

圖片

然后,根據(jù)這一發(fā)現(xiàn)可以推斷出在少樣本設(shè)置中關(guān)于涌現(xiàn)的預(yù)測(cè)。

圖片

作者利用四個(gè)標(biāo)準(zhǔn) NLP 基準(zhǔn)來(lái)驗(yàn)證涌現(xiàn)定律,結(jié)果發(fā)現(xiàn)涌現(xiàn)定律可以提前準(zhǔn)確預(yù)測(cè)涌現(xiàn)點(diǎn),最多可提前 4 倍 FLOP。

圖片

接下來(lái)作者進(jìn)行了這樣一個(gè)實(shí)驗(yàn),就預(yù)訓(xùn)練 FLOPS 而言,可以提前多久成功做出預(yù)測(cè)。結(jié)果發(fā)現(xiàn),可以提前預(yù)測(cè)涌現(xiàn)的程度在某種程度上取決于任務(wù)。

在 MMLU 和 GSM8K 上,可以分別提前最多 4.3 倍和 3.9 倍的 FLOPS 涌現(xiàn)出現(xiàn)。然而,在 CommonsenseQA 和 CoLA 上,分別只能提前預(yù)測(cè) 1.9 倍和 2.3 倍。

圖片

最后,作者還進(jìn)行了真實(shí)世界的案例研究:1)低成本評(píng)估預(yù)訓(xùn)練數(shù)據(jù)質(zhì)量(左)。2)使用困難 APPS 編碼基準(zhǔn)預(yù)測(cè)更復(fù)雜的能力,更接近未來(lái)前沿模型的能力(右)。

圖片

感興趣的讀者可以閱讀論文原文,了解更多研究?jī)?nèi)容。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2023-08-05 13:45:46

模型AI

2023-08-15 14:18:19

智能研究

2024-03-04 08:15:00

2023-05-04 14:55:02

模型AI

2025-04-30 09:09:00

2024-11-26 13:40:00

2023-04-07 09:28:31

模型訓(xùn)練

2023-01-12 13:03:00

數(shù)據(jù)開(kāi)源

2025-04-18 08:42:52

模型推理AI

2023-07-01 13:27:55

2023-08-14 08:37:54

2024-01-09 12:53:16

模型訓(xùn)練

2025-01-22 15:21:00

2025-10-15 09:11:41

2023-04-07 13:54:37

模型AI

2024-04-07 00:45:00

開(kāi)源模型

2023-12-04 13:52:00

模型數(shù)據(jù)

2023-05-31 16:15:51

模型圖像

2023-11-14 07:47:42

IGN擴(kuò)散模型

2023-05-26 17:20:29

模型工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

黄色网页在线播放| 亚洲福利视频在线| 999久久久国产精品| 久久亚洲精品中文字幕| 亚洲精品无吗| 久久99久久精品| 亚洲人成电影网站色| 大陆极品少妇内射aaaaaa| 免费 成 人 黄 色| 日韩特级毛片| 亚洲三级影院| 国产偷自视频区视频一区二区| 国产欧美亚洲精品a| 六十路在线观看| 在线国产1区| 久久久久久久久久久久久久国产| 亚洲 日韩 国产第一区| 欧洲av一区| 亚洲欧美影院| 欧美日韩国产三区| 国产区欧美区日韩区| 久草.com| 少妇一区视频| 精品国产一区二区三区噜噜噜| 精品国产成人| 亚洲欧美成人| 国产伦理精品不卡| 亚洲精品v日韩精品| 欧美性猛交xxxx黑人猛交| 欧美男女性生活在线直播观看| 91麻豆精品91久久久久久清纯 | 欧美一区观看| 午夜精品亚洲一区二区三区嫩草| 欧美精品在欧美一区二区| 邪恶网站在线观看| h1515四虎成人| 少妇精品视频在线观看| 欧美gay囗交囗交| 永久免费毛片在线播放| 国产区视频在线播放| 69久久久久| 欧美重口另类| 8x8x8国产精品| 亚洲人成电影网站色xx| 国产亚洲激情在线| 日韩综合中文字幕| 嘿咻视频在线看| 欧美aaa在线观看| 国产欧美婷婷中文| 少妇av一区二区三区| 欧美日本不卡视频| 亚洲激情自拍偷拍| 久久一日本道色综合| 免费在线观看成人| 亚洲精品在线观看91| 成人在线tv视频| 中文字幕这里只有精品| 午夜视频在线观看网站| 成人c视频免费高清在线观看| 少妇人妻无码专区视频| 免费电影一区| 成人久久一区二区三区| 欧美激情乱人伦| 亚洲精品中文字幕有码专区| 欧美日韩国产精选| 亚洲福利视频一区| 日本一区二区成人在线| 国产xxx精品视频大全| 久久精品日韩欧美| 欧美aⅴ99久久黑人专区| 国产成人精品一区二区免费看京| 玖玖玖电影综合影院| 永久免费毛片在线播放| 性xxxxfjsxxxxx欧美| 国产youjizz在线| 在线免费福利| 精产国产伦理一二三区| 天天干天天干天天干天天干天天干| 成人性做爰片免费视频| 色一情一区二区三区四区| av一区二区三区免费| 国产精品久久久久久久久粉嫩av| 欧美成人高清视频| 色综合.com| 国产91精品青草社区| 久久韩剧网电视剧| 亚洲精品少妇网址| 欧美精品一区二区在线观看| 欧美性视频一区二区三区| 亚洲动漫第一页| 国产精品国产精品国产专区不片| 99riav一区二区三区| 国产成a人无v码亚洲福利| 国产精品2024| 东方欧美亚洲色图在线| 国产成人精品免费一区二区| 国产精品一级在线| 国产精品 日产精品 欧美精品| 六月丁香婷婷久久| 日韩高清电影一区| 国产精品久久国产愉拍| 久久电影一区| 日韩国产成人精品| 久久精品国产秦先生| 精品在线一区二区| 精品一区二区av| 国产精品影音先锋| 成人免费观看视频| 91亚洲国产成人精品一区二区三| 972aa.com艺术欧美| 国产欧美精品一区二区三区四区| 国产精品每日更新| 亚洲精品乱码久久久久久| 亚洲永久精品国产| 色综合久久久久综合体| 欧美日韩情趣电影| 日韩一区二区精品葵司在线| 精品999在线播放| 亚洲美女中文字幕| 日韩三级影视基地| 97在线观看视频| 国产精品久久久久久久久久久久 | 蜜桃999成人看片在线观看| 欧美极品一区| 欧美不卡1区2区3区| 亚洲高清视频一区| 国产一区二区三区小说| 亚洲欧洲一区二区| 久久国产精品99久久久久久老狼| 亚洲高清极品| 国产国产精品| 中文高清一区| 国产一区二区三区综合| 91亚洲国产成人精品一区二区三| 中文字幕一区在线观看视频| 亚洲电影中文字幕在线观看| 欧美久久一二区| 亚洲美女在线看| 久久中文字幕视频| 欧美一级视频在线观看| 亚洲aaa激情| 日韩香蕉视频| 精品性高朝久久久久久久| 国产精品久久毛片av大全日韩| 最新中文字幕一区二区三区| 日韩欧美国产骚| 欧美一区二区高清| 一区二区三区高清国产| 97精品伊人久久久大香线蕉| 91精品中文在线| 亚洲国产日韩综合一区| 情侣黄网站免费看| 中文字幕大看焦在线看| 污污的网站在线免费观看| 成人亚洲免费| 青青视频在线播放| 欧美成人一区二区三区在线观看 | 国产精品jizz视频| 在线成人av电影| 欧美伦理片在线看| 国自产拍在线网站网址视频| 免费在线小视频| 精品精品国产毛片在线看| 欧美高清日韩| 国产成+人+日韩+欧美+亚洲| 亚洲在线成人精品| 欧美一区二区免费观在线| 久久精品国产亚洲7777| 成人免费大片黄在线播放| 一区二区三区我不卡| 久久久久久香蕉| 国产高清一区在线观看| 亚洲成人av观看| 久久亚洲国产| 韩国一区二区在线观看| 一区二区理论电影在线观看| 亚洲第一在线视频| 51精品在线观看| 日韩欧美一区二区三区久久婷婷| 一本岛在线视频| 国产成人无吗| 久久精品66| 美女精品自拍一二三四| 亚洲精品国产精品乱码不99| 精品国产乱码久久久久久1区2区| 5566日本婷婷色中文字幕97| 青青成人在线| 黄色毛片av| 欧美少妇精品| 97视频热人人精品免费| 不卡在线观看av| 欧美女孩性生活视频| 午夜精品免费视频| 日本一区视频在线播放| 欧美xxxxxxxxx59| 自由日本语热亚洲人| 欧美二区视频| 国产精品久久久久影院| 亚洲毛片在线免费观看| 96sao精品视频在线观看|