国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

擊敗GPT-4o的開源模型如何煉成?關(guān)于Llama 3.1 405B,Meta都寫在這篇論文里了

人工智能 新聞
Meta 公布了《The Llama 3 Herd of Models》論文,揭示了 Llama 3 系列模型迄今為止的研究細(xì)節(jié)。

經(jīng)歷了提前兩天的「意外泄露」之后,Llama 3.1 終于在昨夜由官方正式發(fā)布了。

Llama 3.1 將上下文長(zhǎng)度擴(kuò)展到了 128K,擁有 8B、70B 和 405B 三個(gè)版本,再次以一已之力抬高了大模型賽道的競(jìng)爭(zhēng)標(biāo)準(zhǔn)。

對(duì) AI 社區(qū)來說,Llama 3.1 405B 最重要的意義是刷新了開源基礎(chǔ)模型的能力上限,Meta 官方稱,在一系列任務(wù)中,其性能可與最好的閉源模型相媲美。

下表展示了當(dāng)前 Llama 3 系列模型在關(guān)鍵基準(zhǔn)測(cè)試上的性能。可以看出,405B 模型的性能與 GPT-4o 十分接近。

圖片

與此同時(shí),Meta 公布了《The Llama 3 Herd of Models》論文,揭示了 Llama 3 系列模型迄今為止的研究細(xì)節(jié)。

圖片

論文地址:https://ai.meta.com/research/publications/the-llama-3-herd-of-models/

接下來,讓我們看一下論文內(nèi)容。

Llama3 論文亮點(diǎn)

1、在使用 8K 上下文長(zhǎng)度進(jìn)行預(yù)訓(xùn)練后,Llama 3.1 405B 使用 128K 上下文長(zhǎng)度進(jìn)行連續(xù)訓(xùn)練,且支持多語(yǔ)言和工具使用。

2、與以前的 Llama 模型相比,Meta 加強(qiáng)了預(yù)處理和預(yù)訓(xùn)練數(shù)據(jù)的 Curation pipelines,以及后訓(xùn)練數(shù)據(jù)的質(zhì)量保證和過濾方法。

Meta 認(rèn)為,高質(zhì)量基礎(chǔ)模型的開發(fā)有三個(gè)關(guān)鍵杠桿:數(shù)據(jù)、規(guī)模和復(fù)雜性管理。

首先,與 Llama 的早期版本相比,Meta 在數(shù)量和質(zhì)量?jī)煞矫娓倪M(jìn)了用于預(yù)訓(xùn)練和后訓(xùn)練的數(shù)據(jù)。Meta 在大約 15 萬(wàn)億的多語(yǔ)言 Token 語(yǔ)料庫(kù)上對(duì) Llama 3 進(jìn)行了預(yù)訓(xùn)練,相比之下,Llama 2 只使用了 1.8 萬(wàn)億 Token。

此次訓(xùn)練的模型規(guī)模遠(yuǎn)大于以前的 Llama 模型:旗艦語(yǔ)言模型使用了 3.8 × 102? 次浮點(diǎn)運(yùn)算(FLOPs)進(jìn)行預(yù)訓(xùn)練,超過 Llama 2 的最大版本近 50 倍。

基于 Scaling law,在 Meta 的訓(xùn)練預(yù)算下,當(dāng)前的旗艦?zāi)P鸵咽墙朴?jì)算最優(yōu)的規(guī)模,但 Meta 對(duì)較小模型進(jìn)行的訓(xùn)練時(shí)間已經(jīng)遠(yuǎn)超計(jì)算最優(yōu)的時(shí)長(zhǎng)。結(jié)果表明,這些較小模型在相同推理預(yù)算下的表現(xiàn)優(yōu)于計(jì)算最優(yōu)模型。在后訓(xùn)練階段,Meta 使用了 405B 的旗艦?zāi)P瓦M(jìn)一步提高了 70B 和 8B 模型這些較小模型的質(zhì)量。

3、為了支持 405B 模型的大規(guī)模生產(chǎn)推理,Meta 將 16 位 (BF16) 量化為 8 位 (FP8),從而降低了計(jì)算要求,并使模型能夠在單個(gè)服務(wù)器節(jié)點(diǎn)上運(yùn)行。

4、在 15.6T token(3.8x102?  FLOPs)上預(yù)訓(xùn)練 405B 是一項(xiàng)重大挑戰(zhàn),Meta 優(yōu)化了整個(gè)訓(xùn)練堆棧,并使用了超過 16K H100 GPU。

正如 PyTorch 創(chuàng)始人、Meta 杰出工程師 Soumith Chintala 所說,Llama3 論文揭示了許多很酷的細(xì)節(jié),其中之一就是基礎(chǔ)設(shè)施的構(gòu)建。

圖片

5、在后訓(xùn)練中,Meta 通過多輪對(duì)齊來完善 Chat 模型,其中包括監(jiān)督微調(diào)(SFT)、拒絕采樣和直接偏好優(yōu)化。大多數(shù) SFT 樣本由合成數(shù)據(jù)生成。

研究者在設(shè)計(jì)中做出了一些選擇,以最大化模型開發(fā)過程的可擴(kuò)展性。例如,選擇標(biāo)準(zhǔn)的密集 Transformer 模型架構(gòu),只進(jìn)行了少量調(diào)整,而不是采用專家混合模型,以最大限度地提高訓(xùn)練的穩(wěn)定性。同樣,采用相對(duì)簡(jiǎn)單的后訓(xùn)練程序,基于監(jiān)督微調(diào)(SFT)、拒絕采樣(RS)和直接偏好優(yōu)化(DPO),而不是更復(fù)雜的強(qiáng)化學(xué)習(xí)算法, 因?yàn)楹笳咄€(wěn)定性較差且更難擴(kuò)展。

6、作為 Llama 3 開發(fā)過程的一部分,Meta 團(tuán)隊(duì)還開發(fā)了模型的多模態(tài)擴(kuò)展,使其具備圖像識(shí)別、視頻識(shí)別和語(yǔ)音理解的能力。這些模型仍在積極開發(fā)中,尚未準(zhǔn)備好發(fā)布,但論文展示了對(duì)這些多模態(tài)模型進(jìn)行初步實(shí)驗(yàn)的結(jié)果。

7、Meta 更新了許可證,允許開發(fā)者使用 Llama 模型的輸出結(jié)果來增強(qiáng)其他模型。

在這篇論文的最后,我們還看到了長(zhǎng)長(zhǎng)的貢獻(xiàn)者名單:

圖片

這一系列因素,最終造就了今天的 Llama 3 系列。

當(dāng)然,對(duì)于普通開發(fā)者來說,如何利用 405B 規(guī)模的模型是一項(xiàng)挑戰(zhàn),需要大量的計(jì)算資源和專業(yè)知識(shí)。

發(fā)布之后,Llama 3.1 的生態(tài)系統(tǒng)已準(zhǔn)備就緒,超過 25 個(gè)合作伙伴提供了可與最新模型搭配使用的服務(wù),包括亞馬遜云科技、NVIDIA、Databricks、Groq、Dell、Azure、Google Cloud 和 Snowflake 等。

更多技術(shù)細(xì)節(jié),可參考原論文。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-09-06 13:00:29

2025-04-08 02:26:00

2024-07-24 09:20:45

2024-09-19 14:00:00

模型開源代碼

2024-05-30 12:50:05

2024-12-26 07:10:00

2024-07-23 09:20:35

2024-10-08 15:00:00

2024-07-29 09:20:00

AI模型

2024-07-24 13:58:25

2024-10-06 09:00:00

AI訓(xùn)練數(shù)據(jù)

2025-05-26 09:05:00

2024-10-17 14:05:34

2024-08-02 14:53:00

2025-08-07 14:05:40

OpenAI大模型開源

2024-10-17 13:30:00

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2025-05-27 15:19:52

GPUMetaGPT-4o

2025-10-28 02:11:00

2025-03-31 09:46:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产在线1区| 成人黄色av网址| 久久久久国产成人精品亚洲午夜| 97久久夜色精品国产九色| 亚洲午夜国产成人| 精品亚洲国产视频| 牛牛在线精品视频| 欧美在线视频全部完| 国产最顶级的黄色片在线免费观看 | 成人激情综合网| 国产精品nxnn| 欧美第一黄网免费网站| 少妇高潮一区二区三区99| 亚洲免费中文字幕| xxxcom在线观看| 欧美另类一区二区三区| 欧美捆绑视频| 欧美日在线观看| 你懂的在线看| 日本精品免费观看高清观看| 电影在线高清| 91精品午夜视频| 久久99精品久久久久久野外| 欧美精品精品一区| 国产一二三区在线观看| 精品日本一线二线三线不卡| 阿v视频在线| 国产一区二区三区在线播放免费观看| av人人综合网| 色妞一区二区三区| 国产精品调教视频| 国产精品免费电影| 国产精品v日韩精品v欧美精品网站 | 91精品免费视频| 91精品秘密在线观看| 国产精品久久亚洲7777| 天使萌一区二区三区免费观看| 色一情一区二区三区四区| 九色|91porny| 国产淫片免费看| 亚洲另类春色国产| 欧美白人做受xxxx视频| 欧美性受xxxx| 国产精品迅雷| 91av视频在线观看| 国产精品v亚洲精品v日韩精品 | 免费看又黄又无码的网站| 亚洲国产精华液网站w| 九色福利视频| 欧美欧美欧美欧美| 国产伦精品一区二区三区视频金莲| 日日噜噜噜夜夜爽亚洲精品| 日本中文字幕在线一区| 999在线观看免费大全电视剧| 蜜桃视频一区二区三区| 亚洲福利精品视频| 欧美色视频一区| 成人做爰视频www网站小优视频| 久久久亚洲国产| 国产一区二区三区四区三区四| 手机看片日韩国产| 亚洲人吸女人奶水| 五月花成人网| 久久久久久久激情视频| 亚洲精品三级| 粗暴91大变态调教| 欧美三级电影网站| 精品中文在线| 国产欧美丝袜| 中文字幕巨乱亚洲| www视频在线免费观看| 久久久久久中文字幕| 国产偷自视频区视频一区二区| 精品一区二区中文字幕| 欧美日韩精品一区二区在线播放| 成人在线中文| 国产色综合一区二区三区| 91色|porny| a毛片在线观看| 日韩免费av在线| 日韩精品三区四区| 成年人在线播放| 日韩在线视频观看| 日韩午夜一区| 国产精品影视| 永久555www成人免费| 亚洲网站视频| 中文字幕高清20页| 亚洲色图欧美制服丝袜另类第一页| 99久久激情| 色综合天天色综合| 亚洲另类图片色| 亚洲一级高清| 欧美aaa一级| 久久最新资源网| 久久国产精品无码网站| 天堂在线中文字幕| 久久久在线免费观看| 国产成人自拍网| 18网站在线观看| 99理论电影网| 亚洲成av人片一区二区梦乃 | 秋霞午夜av一区二区三区| 男人天堂午夜在线| 国模精品系列视频| 成人高清在线视频| 国产h片在线观看| 国产一区二区免费电影| 天天综合日日夜夜精品| 亚洲图片久久| 欧美成人福利在线观看| 在线播放国产一区中文字幕剧情欧美 | 中文字幕av一区中文字幕天堂| 久久久久国产精品一区二区 | 粉嫩av一区二区三区免费野| 精品丝袜久久| 亚洲高清在线免费观看| 日韩在线免费av| 国产91精品露脸国语对白| a级片在线免费观看| 日韩区国产区| 91精品国产欧美一区二区18| 伊人影院久久| 日本蜜桃在线观看| 国产日韩一区欧美| 欧美日韩成人综合天天影院| 亚洲午夜在线| 天堂中文8资源在线8| 国产伦精品一区二区三区四区免费 | 小小影院久久| 欧美色18zzzzxxxxx| 亚洲一区二区三区四区在线播放| 亚洲一卡二卡三卡四卡 | 国产玉足榨精视频在线观看| 亚洲一区亚洲二区| 黑人精品xxx一区一二区| 一区二区电影在线观看| 亚洲kkk444kkk在线观看| 91久久在线观看| 色婷婷久久综合| 欧美一区高清| 国产原创视频在线观看| 午夜精品一区二区三区四区| 亚洲精品一区久久久久久| 成人福利视频网站| 日本99精品| 啦啦啦在线视频免费观看高清中文 | 在线免费成人| 午夜欧美福利视频| 清纯唯美亚洲综合| 精品国产91久久久久久老师| 国产综合网站| 国产精品偷拍| 日本中文字幕网址| 午夜精品三级视频福利| 午夜精品福利在线| 国产日韩欧美高清免费| 黄色软件视频在线观看| 国产又黄又大又粗视频| 午夜精品蜜臀一区二区三区免费| 亚洲精品国产一区二区精华液| 亚洲国产老妈| 麻豆理论在线观看| 国产免费999| 亚洲aaa激情| 日韩av在线不卡| 国产亚洲欧美日韩日本| 日韩久久综合| 久久大胆人体| 日本人视频jizz页码69| 99国产在线| 中文字幕欧美精品日韩中文字幕| 亚洲视频一区二区在线| 激情久久久久久久| 亚洲高清影院| 成人资源www网在线最新版| 伊人天天久久大香线蕉av色| 欧美日韩国产第一页| 欧美网站在线观看| 久久99精品久久久久| 色天下一区二区三区| av在线免费播放| 日日碰狠狠添天天爽超碰97| 激情开心成人网| 粉嫩一区二区三区| 粉嫩一区二区三区在线看| 99精品国产一区二区三区2021 | 922tv免费观看在线| 欧美日韩一区二区视频在线观看| 色老头一区二区三区在线观看| 亚洲狠狠爱一区二区三区| 日韩中文字幕1| 色88888久久久久久影院| 91蜜桃在线视频| 先锋成人影院| 色一情一乱一伦一区二区三欧美 | 国产免费内射又粗又爽密桃视频| 国产精品久久久久久久电影| 亚洲少妇中文在线| 欧美日韩精品在线|