国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

顛覆LLM格局!AI2新模型OLMo2,訓練過程全公開,數(shù)據(jù)架構雙升級

人工智能 新聞
非營利研究機構AI2近日推出的完全開放模型OLMo 2,在同等大小模型中取得了最優(yōu)性能,且該模型不止開放權重,還十分大方地公開了訓練數(shù)據(jù)和方法。

最近,非營利研究機構AI2上新了OLMo2系列模型,他們稱之為「迄今為止最好的完全開源模型」。

圖片

OLMo 2系列包含7B和13B兩個型號,相比如Llama 3.1和Qwen 2.5等開源模型達到了同等甚至更優(yōu)的性能,同時FLOPS計算量更少,在性能和計算效率之間取得了極佳的平衡,為開源LLM開辟了新的可能性。

圖片

不同大小開源模型的性能對比,OLMo 2的表現(xiàn)優(yōu)于同參數(shù)規(guī)模模型

在多個下游任務上,OLMo 2展現(xiàn)出了強大的泛化能力和適應能力。在10個基準上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基準均分也超過了Llama-3.1-8B。

圖片

訓練過程全公開

不同于Llama、Qwen這類只開源模型權重的項目,這次AI2也秉持了一貫的開源風格,即不止發(fā)布了訓練好的OLMo 2模型權重,還公開了訓練數(shù)據(jù)、代碼、訓練過程。這無疑為之后的LLM的研究和應用提供了寶貴的資源。

圖片

論文地址:https://arxiv.org/pdf/2501.00656

OLMo 2的訓練過程分為3個階段,分別是預訓練、中期訓練和后期的指令調(diào)優(yōu)。預訓練數(shù)據(jù)混合了高質(zhì)量的網(wǎng)頁數(shù)據(jù)、代碼數(shù)據(jù)和學術論文數(shù)據(jù)等。

在預訓練階段,OLMo 2通過多種技術改進了訓練穩(wěn)定性,例如過濾重復的n-gram、使用更好的初始化方法、架構改進和超參數(shù)調(diào)整。這確保了模型在訓練過程中不會出現(xiàn)崩潰或損失激增,從而提高了最終模型的性能。

圖片

預訓練使用的高質(zhì)量數(shù)據(jù)集

中期訓練階段使用高質(zhì)量的領域特定數(shù)據(jù)(例如數(shù)學數(shù)據(jù)),以及合成數(shù)據(jù),來增強模型的能力,特別是在數(shù)學任務上的表現(xiàn);加上微退火技術評估以及選擇高質(zhì)量的數(shù)據(jù)源,進一步優(yōu)化了中期訓練的效果。

圖片

中期訓練使用的高質(zhì)量數(shù)據(jù)集

最后的指令調(diào)優(yōu)階段,研究人員基于Tülu 3的指令調(diào)優(yōu)方法,開發(fā)了OLMo 2-Instruct模型,專注于使用許可數(shù)據(jù),并擴展最終階段的強化學習與可驗證獎勵(RLVR)。

此外,監(jiān)督微調(diào)(SFT)、直接偏好優(yōu)化(DPO)和RLVR等多階段訓練,顯著提高了模型的指令跟隨能力和生成質(zhì)量。

OLMo 2的開源是全方位的,包括所有用于復制和擴展這些模型所需的訓練和評估代碼、數(shù)據(jù)集、模型檢查點、日志及超參數(shù)的選擇等,相比只開源權重,使更多研究人員和開發(fā)者能夠使用和改進這些模型。

通過開源所有組件,OLMo 2促進了對語言模型行為和使用的理解和研究,促進語言模型研究的透明度和可重復性,這些足以成為之后研究所依賴的基礎設施。

圖片

OLMo 2 7B和13B模型的訓練過程中的超參數(shù)

多管齊下造就「低碳」LLM

在大規(guī)模語言模型訓練中,計算資源和環(huán)境影響是不可忽視的因素。Deepseek V3能夠以20分之一的成本進行訓練,而OLMo 2團隊也通過減少主機-設備同步、數(shù)據(jù)預處理、數(shù)據(jù)緩存等多種方法降低了訓練成本,并取得了顯著的成效。

OLMo 2的訓練主要在兩個集群上進行:Jupiter和Augusta。Jupiter集群配備了128個節(jié)點,每個節(jié)點有8張H100,總共1024個GPU;Augusta集群由160個A3 Mega虛擬機組成,每個虛擬機也有8張H100,總共1280個GPU。

OLMo 2的7B模型在4.05萬億token上進行訓練,13B模型在5.6萬億token上進行訓練。訓練時間取決于模型的參數(shù)規(guī)模和訓練數(shù)據(jù)量。

同時為了降低能源消耗,團隊使用水冷系統(tǒng)來降低GPU的溫度和功耗,從而提高訓練效率并降低電力成本。

這些措施加在一起,相比訓練同大小的Llama 3.1所消耗的1022MWh電力,OLMo 2 7B訓練過程中總計只消耗了131MWh的電力,相當于只有約10分之一的耗電量,顯著降低了訓練過程消耗的算力,能源及碳足跡。

圖片

OLMo 和Llama訓練能耗的對比

OLMo 2的發(fā)布,標志著開源LLM的持續(xù)進步,為相關領域的研究建立一個新生態(tài)系統(tǒng)。在這個生態(tài)系統(tǒng)中,新的訓練方法和技術需要被理解和分享。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-04 09:17:00

模型數(shù)據(jù)

2023-06-15 14:06:13

2024-11-12 09:20:03

神經(jīng)網(wǎng)絡語言模型

2021-07-30 18:35:57

數(shù)據(jù)建模聚類

2025-08-24 09:24:07

2025-02-17 14:34:52

2025-11-10 08:43:00

AI視頻生成模型

2024-08-19 13:16:16

2025-03-25 09:04:55

2025-02-03 00:00:01

Ai2o1LLM

2024-11-26 10:44:18

2023-09-18 13:13:00

人工智能訓練

2025-03-03 10:42:50

深度學習PyTorch大型語言模型

2023-06-25 13:37:09

GPT-4AI

2024-12-10 16:00:00

AI開源

2025-02-12 13:42:25

2025-06-13 09:29:51

2025-12-04 08:57:47

2024-04-25 09:25:33

2025-09-19 10:10:18

點贊
收藏

51CTO技術棧公眾號

中文字幕在线视频观看| 丁香婷婷深情五月亚洲| 精品香蕉视频| 国产精品美女久久福利网站| 日韩高清欧美高清| 不卡视频一区二区| 黄色影院在线播放| 韩国自拍一区| 国产视频自拍一区| 日韩精品大片| 国产欧美在线观看免费| 久久新电视剧免费观看| 在线观看欧美日韩国产| 996这里只有精品| 国产一级网站视频在线| 国产精品欧美一区二区三区不卡 | 亚洲欧美久久| 欧美日本视频在线| 欧美艳星kaydenkross| 色婷婷综合久久久中文字幕| 亚洲男人av电影| 久久99国产精品久久99果冻传媒| 欲色天天网综合久久| 日韩av一二三四| 在线日韩一区| 欧美日产国产精品| 亚洲一区二区不卡视频| 老司机精品视频网| 久久久五月婷婷| 亚洲综合av影视| 欧美美女日韩| 色哟哟一区二区三区| 91动漫在线看| 国产伦理一区| 国产99视频精品免视看7| aa视频在线观看| 亚洲欧美另类久久久精品2019| 成人免费福利在线| av五月天在线| 深夜在线视频| 国产精品一区一区| 国产精品一二三在线| 久久av在线| 成人影院在线观看| 99re热视频精品| 97午夜影院| 亚洲精品视频在线观看免费| 第四色亚洲色图| 精品日本高清在线播放| 日产精品久久久久久久性色| 国产精品永久在线| **国产精品| 久久伦理中文字幕| 欧美熟乱第一页| 116极品美女视频在线观看| 美女在线观看视频一区二区| 欧美激情精品久久久久| 高潮在线视频| 欧美一级搡bbbb搡bbbb| 国产网站av| 国产精品久久久久久久久免费桃花| 久草免费福利在线| 极品少妇一区二区| 自拍视频一区二区三区| 久久久久久久久久久久久久久99 | 激情开心成人网| 自拍偷拍国产亚洲| 国产日韩精品在线观看| 国产人成在线观看| 在线看日本不卡| 国产一区精品二区| 免费白浆视频| 国产精品99久久久久久董美香| 久久久国产在线视频| 日韩av黄色在线| 欧美久久久久久久| www.欧美精品一二区| 亚洲第一免费播放区| xvideos.蜜桃一区二区| 三级欧美韩日大片在线看| 国外成人在线视频网站| 99国产精品| 久久久综合香蕉尹人综合网| 韩国欧美一区二区| 久久久久久免费看| 97久久超碰国产精品电影| jizzzz日本| 一本久久精品一区二区| www.综合| 国产精品天天狠天天看| 欧美久久99| 国产精品-区区久久久狼| 国产精品欧美经典| 国产理论电影在线观看| 亚洲日韩中文字幕| 欧美一级精品片在线看| 国产经典久久久| 欧美日韩国产精品一区二区三区四区| 国产亚洲天堂网| 中文字幕国产一区二区| 视频一区二区三区在线看免费看| 中文字幕在线不卡| 91香蕉嫩草影院入口| 9191国语精品高清在线| 91网站在线观看免费| 亚洲精品久久久久久久久| 亚洲精品成a人| 一本一道久久a久久精品综合| 久久男人中文字幕资源站| 看女生喷水的网站在线观看| 久久久久久有精品国产| 销魂美女一区二区三区视频在线| 日韩av在线免费播放| 波多野结衣欧美| 亚洲黄色成人久久久| 中文字幕一区在线观看视频| www中文字幕在线观看| 国产精品高潮呻吟久久av无限| 国产日韩欧美精品电影三级在线| 欧美xnxx| 中文字幕日韩精品无码内射| 色拍拍在线精品视频8848| 国产精品一区免费在线| 欧美a在线视频| 欧美激情亚洲精品| 色欧美88888久久久久久影院| 色777狠狠狠综合伊人| 国产在线视频你懂得| 日韩av免费电影| 久久精品色欧美aⅴ一区二区| 亚洲欧洲日产国码二区| 欧美日韩一区二区三区四区不卡| 国产精品无码av无码| 国语自产偷拍精品视频偷| 亚洲精品水蜜桃| 18+视频在线观看| 日韩免费黄色av| 成人sese在线| 999国产精品亚洲77777| 日韩精品在线网站| 青青一区二区| 午夜成人影视| 在线免费观看av的网站| 蜜臀久久99精品久久久酒店新书| 三妻四妾的电影电视剧在线观看| 国产精品视频播放| 中文字幕一区二区三区精华液 | 不用播放器成人网| 精品一区二区三区免费观看| 在线免费观看黄色| 熟妇熟女乱妇乱女网站| 97在线视频精品| 色婷婷精品大在线视频 | 中文字幕在线观看不卡视频| 日韩欧美四区| 亚洲激情自拍偷拍| 久久夜色精品国产噜噜av小说| 992tv在线| 国产老熟妇精品观看| 99久久99久久| 日韩资源在线观看| 日韩高清欧美高清| 欧美妇女性影城| 亚洲国产精品一区二区www| 国产a精品视频| 精品在线免费视频| 久久精品国产亚洲夜色av网站 | 伊人天天久久大香线蕉av色| 欧美一区第一页| 成人做爽爽免费视频| 男人透女人免费视频| 久久久久久久久久久久久国产| 日韩精品视频一二三| 日本最黄视频| 成年丰满熟妇午夜免费视频 | 欧美成人tv| 福利欧美精品在线| 日本成人一区二区| 成人av毛片| 黄色在线网站| 香蕉视频网站在线观看| 激情亚洲小说| 欧美成人一品| 精品国产一区二区国模嫣然| 日韩人妻精品一区二区三区| 欧美黑粗硬大| 国产精品色在线| 91久久中文字幕| av毛片在线免费看| 国产高清精品网站| 欧美中文字幕亚洲一区二区va在线| 欧美一级一区| 天堂综合网久久| 欧美视频成人| 日本国产一区二区| 日本在线播放一区| 偷拍精品精品一区二区三区| 91在线国产观看| 国产精品久久久久久亚洲影视| 日本福利午夜视频在线|