国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Meta 發(fā)布Llama 3,能力直逼GPT-4,一己之力拉高開源大模型水位

原創(chuàng) 精選
人工智能
眾所周知,諸如MMLU(旨在衡量知識(shí))、ARC(試圖衡量技能習(xí)得)和DROP(測(cè)試模型對(duì)文本片段的理解能力)等流行AI基準(zhǔn)測(cè)試的有效性和實(shí)用性尚存爭(zhēng)議。但無(wú)論好壞,它們?nèi)允茿I玩家評(píng)估其模型的少數(shù)標(biāo)準(zhǔn)化手段之一。

編輯 | 伊風(fēng)、諾亞

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

Meta麾下“羊駝”一路狂奔在開源的大道上。

在過去的一年里,Llama系列可以說(shuō)開辟了開源LLM的半壁江山。

嫌棄開源模型能力只有GPT-3.5,不夠用?

如今Llama 3發(fā)布,又是一石激起千層浪。粗看其基礎(chǔ)benchmark,足以讓國(guó)內(nèi)外一眾大模型公司瑟瑟發(fā)抖。借用一句業(yè)內(nèi)人士的話,“性能上來(lái)說(shuō)感覺就是GPT-3.7的水平。一己之力急速拉高了開源水位”。

首先從數(shù)據(jù)層面看,Llama 3 在15T tokens上進(jìn)行了訓(xùn)練,踐行了又一次堪稱恐怖的大力出奇跡;再者從訓(xùn)練資源方面看,2.4萬(wàn)卡集群訓(xùn)練的部署也足以展示Meta的志在必得。

Llama 3讓Meta重奪開源大模型的王位,且其性能無(wú)限接近甚至超過OpenAI GPT、Gemini和Claude等閉源大模型。

難怪Meta有底氣放言,就各自的參數(shù)數(shù)量而言,經(jīng)過兩個(gè)定制的24000 GPU集群訓(xùn)練的Llama 3 8B和Llama 3 70B是目前可用的性能最佳的生成式AI模型之一。

更加勁爆的是。扎克伯格在最新訪談中透露,Llama3的三個(gè)版本中,是80億參數(shù)、700億參數(shù)的模型開源了,而超過 4000 億個(gè)模型還在加緊訓(xùn)練的路上……

圖片圖片

有網(wǎng)友在訪談下調(diào)侃道,難怪扎克伯格看起來(lái)如此“人性化”,肯定是偷偷運(yùn)行Llama 3了!

圖片圖片

讓小扎都更加AGI的Llama 3,究竟為何能這么牛呢,不妨來(lái)一起看看其細(xì)節(jié)! 

一、性能 PK,刺刀見紅:Llama3恐怖如斯

Meta力大磚飛確實(shí)有奇效!扎克伯格說(shuō),Llama3 80億的模型幾乎與此前發(fā)布的最大版本的Llama2(參數(shù)700億)一樣強(qiáng)大。

眾所周知,諸如MMLU(旨在衡量知識(shí))、ARC(試圖衡量技能習(xí)得)和DROP(測(cè)試模型對(duì)文本片段的理解能力)等流行AI基準(zhǔn)測(cè)試的有效性和實(shí)用性尚存爭(zhēng)議。但無(wú)論好壞,它們?nèi)允茿I玩家評(píng)估其模型的少數(shù)標(biāo)準(zhǔn)化手段之一。

Llama 3 8B在至少九項(xiàng)基準(zhǔn)測(cè)試中超越了其他開源模型,如Mistral的Mistral 7B和Google的Gemma 7B:MMLU、ARC、DROP、GPQA(一組涉及生物、物理和化學(xué)的問題)、HumanEval(一項(xiàng)代碼生成測(cè)試)、GSM-8K(數(shù)學(xué)應(yīng)用題)、MATH(另一項(xiàng)數(shù)學(xué)基準(zhǔn))、AGIEval(問題解決測(cè)試集)以及BIGbench Hard(常識(shí)推理評(píng)估)。

誠(chéng)然,Mistral 7B和Gemma 7B并非處于最前沿(Mistral 7B于去年9月發(fā)布),并且在Meta引用的幾項(xiàng)基準(zhǔn)中,Llama 3 8B僅比二者高出幾個(gè)百分點(diǎn)。但Meta聲稱,參數(shù)數(shù)量更大的Llama 3 70B模型,可與包括Google Gemini系列最新款Gemini 1.5 Pro在內(nèi)的旗艦級(jí)生成式AI模型相媲美。   

圖片圖片

Instruct-tuned模型與Gemma、Mistral、Gemini Pro 1.5、Claude 3 Sonnet在MMLU、GSM-8k等benchmark上的對(duì)比如下:

圖片圖片

Llama 3 70B在MMLU、HumanEval和GSM-8K三項(xiàng)測(cè)試中勝過Gemini 1.5 Pro。盡管它無(wú)法與Anthropic表現(xiàn)最為強(qiáng)勁的模型Claude 3 Opus匹敵,但在五個(gè)基準(zhǔn)(MMLU、GPQA、HumanEval、GSM-8K及MATH)上,Llama 3 70B的成績(jī)優(yōu)于Claude 3系列中第二弱的模型Claude 3 Sonnet。   

為了測(cè)試Llama 3在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試上的性能,Meta甚至特意開發(fā)了一個(gè)新的高質(zhì)量人類評(píng)估集。這個(gè)評(píng)估集包含1800個(gè)提示,涵蓋尋求建議、頭腦風(fēng)暴、角色扮演等12個(gè)關(guān)鍵用例。為了測(cè)試的公平,評(píng)估集不允許自己的建模團(tuán)隊(duì)訪問。結(jié)果是,70B的Llama 3Instruct-tuned模型在人類評(píng)測(cè)中勝過Claude Sonnet和GPT 3.5:

圖片圖片

然而,鑒于測(cè)試集由Meta自身設(shè)計(jì),顯然這些結(jié)果需要持保留態(tài)度看待。

從定性角度來(lái)說(shuō),Meta宣稱新Llama模型的用戶可以期待更高的“可控性”,即模型更愿意回答問題,并且在瑣事問題、涉及歷史和STEM(如工程與科學(xué))領(lǐng)域的提問以及通用編碼建議方面表現(xiàn)出更高的準(zhǔn)確性。

二、Llama 3 技術(shù)細(xì)節(jié),訓(xùn)練集是上代7倍大

在模型架構(gòu)方面,與Llama 2 基本一致,最關(guān)鍵的不同在于以下幾點(diǎn):

1.Llama 3使用了一個(gè)128K Token 的詞匯表,而 Llama-2 的詞匯量為 32K。

2.訓(xùn)練數(shù)據(jù)使用了 15 萬(wàn)億個(gè) Token,而不是 Llama-2 的 2 萬(wàn)億。

3.8 億參數(shù)的模型也使用了分組查詢注意力(GQA)(與 Llama 2 7b 則沒有)。

4.代碼數(shù)據(jù)是原來(lái)的 4 倍。

為了訓(xùn)練Llama 3,Meta在超過15Token的令牌上進(jìn)行了預(yù)訓(xùn)練。所使用的訓(xùn)練數(shù)據(jù)集是Llama 2所使用的七倍。

在Llama 3的開發(fā)過程中,Meta對(duì)scaling law有了一些新體會(huì)。這次訓(xùn)練以Chinchilla做指導(dǎo),但是他們發(fā)現(xiàn)雖然對(duì)于一個(gè)8B模型來(lái)說(shuō),對(duì)應(yīng)的最優(yōu)訓(xùn)練量約200B個(gè)令牌,即使在訓(xùn)練了700億個(gè)Token后,模型性能仍在繼續(xù)提高。

這些龐大的數(shù)據(jù)源自何處?Meta并未透露具體來(lái)源,僅表示數(shù)據(jù)來(lái)自“公開可用資源”,其中包含的代碼量是Llama 2訓(xùn)練集的四倍,并且有5%的非英語(yǔ)數(shù)據(jù)(覆蓋約30種語(yǔ)言),旨在提升除英語(yǔ)外其他語(yǔ)言的表現(xiàn)(不過仍然有大佬吐槽Llama 3的中文表現(xiàn)一般)。Meta還表示使用了合成數(shù)據(jù)(即AI生成的數(shù)據(jù))來(lái)創(chuàng)建長(zhǎng)篇文檔供Llama 3模型訓(xùn)練,這一做法因可能帶來(lái)性能弊端而頗具爭(zhēng)議。

許多生成式AI供應(yīng)商視訓(xùn)練數(shù)據(jù)為競(jìng)爭(zhēng)優(yōu)勢(shì),因此對(duì)其保密。但訓(xùn)練數(shù)據(jù)詳情也是潛在的知識(shí)產(chǎn)權(quán)相關(guān)訴訟源頭,這也成為不愿透露過多信息的另一個(gè)原因。近期報(bào)道顯示,在與AI競(jìng)爭(zhēng)對(duì)手保持同步的過程中,Meta曾不顧自家律師警告,使用受版權(quán)保護(hù)的電子書進(jìn)行AI訓(xùn)練。

那么,對(duì)于生成式AI模型常見的毒性與偏見問題,Llama 3同樣采取了措施。

Meta表示已開發(fā)新的數(shù)據(jù)過濾管道以提升模型訓(xùn)練數(shù)據(jù)質(zhì)量,并更新了其生成式AI安全套件Llama Guard和CybersecEval,旨在防止Llama 3模型及其他模型被濫用以及產(chǎn)生有毒的文本生成。該公司還發(fā)布了一款名為Code Shield的新工具,用于檢測(cè)生成式AI模型產(chǎn)生的可能引入安全漏洞的代碼。然而,過濾并非萬(wàn)無(wú)一失。我們需要等待觀察Llama 3模型在實(shí)際應(yīng)用中的表現(xiàn),包括學(xué)術(shù)界對(duì)其在替代基準(zhǔn)上的測(cè)試。

三、抽干閉源模型的護(hù)城河:4000億參數(shù)的“巨無(wú)霸”已經(jīng)在路上    

Meta指出,Llama 3模型已經(jīng)可以下載。

Llama 3為Facebook、Instagram、WhatsApp、Messenger和網(wǎng)頁(yè)版Meta AI助手提供支持。不久,其將在包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、Nvidia NIM和Snowflake在內(nèi)的廣泛云平臺(tái)上以托管形式提供。

未來(lái),針對(duì)AMD、AWS、Dell、Intel、Nvidia和Qualcomm硬件優(yōu)化的模型版本也將發(fā)布。

盡管Llama 3模型可能廣泛可用,但我們會(huì)將其描述為“開放”而非“開源”。這是因?yàn)?,其Llama系列模型并非如其聲稱的那樣無(wú)附加條件。

它們既可用于研究也可用于商業(yè)應(yīng)用。然而,Meta禁止開發(fā)者使用Llama模型訓(xùn)練其他生成式模型,同時(shí)月活躍用戶超過7億的應(yīng)用開發(fā)者必須向Meta申請(qǐng)?zhí)厥庠S可,Meta將根據(jù)其判斷決定是否授予許可。

更強(qiáng)大的Llama模型已在籌備中。

Meta稱正在訓(xùn)練規(guī)模達(dá)4000億參數(shù)的Llama 3模型,這類模型能夠進(jìn)行多語(yǔ)言對(duì)話,處理更多類型的數(shù)據(jù),理解圖像和其他模態(tài)信息,與文本一樣,這將使Llama 3系列與Hugging Face的Idefics2等開放發(fā)布版本保持一致。

“我們的近期目標(biāo)是讓Llama 3實(shí)現(xiàn)多語(yǔ)言和多模態(tài),具備更長(zhǎng)的上下文理解能力,并在諸如推理和編程等大型語(yǔ)言模型核心功能上繼續(xù)提升整體性能,”Meta在其博客文章中寫道?!拔磥?lái)還有許多值得期待的進(jìn)步?!?   

隨著400B的“巨無(wú)霸”逐漸展露真容,大模型競(jìng)技場(chǎng)的氛圍愈加焦灼。環(huán)視四周,我們可以發(fā)現(xiàn),今天發(fā)布的Llama-3 70B,和Gemini 1.5 Pro,Cohere CMD R+,Claude Sonnet以及老版GPT-4差不多站在了同樣的分界線里。

谷歌曾直言,我們沒有護(hù)城河。OpenAI同樣如此。面對(duì) Llama-3 70B的當(dāng)頭一擊,谷歌最先進(jìn)的模型Gemini1.5 Pro也要避其鋒芒。閉源模型的護(hù)城河每每挖深一點(diǎn),似乎就會(huì)在猝不及防間被扎克伯格抽干一次。大模型的開源與閉源之爭(zhēng)短時(shí)間內(nèi)并不會(huì)有解,但Meta在開源立場(chǎng)上的堅(jiān)持,卻讓這場(chǎng)曠日持久的Battle有了更多的可能性。

就像Yann LeCun在近期的演講中所提到的,我們不能讓少數(shù)幾個(gè)AI助手掌控全世界每個(gè)公民的全部數(shù)字生活。這位AI界的泰斗從始至終堅(jiān)持開源主張,“我們需要的不是一個(gè)AI助手,而是像Llama 2、Mistral和Gemma這樣的基礎(chǔ)模型,任何人都可以對(duì)其進(jìn)行微調(diào)”,這樣我們才可以避免回音室,避免讓少數(shù)幾家AI平臺(tái)來(lái)控制人們的所見所思,真正獲得多樣化的信息來(lái)源。

四、 Llama 3開源,AI賽道玩家誰(shuí)喜誰(shuí)憂?

朱嘯虎在他的“中國(guó)現(xiàn)實(shí)主義AIGC故事”中談?wù)撨^一個(gè)非常現(xiàn)實(shí)的問題:即如果一家公司投入巨資去研發(fā)類似于GPT-4的大模型,而一旦其他組織開源了類似的技術(shù),那么之前的投入可能會(huì)白費(fèi)。

現(xiàn)在開源的王Llama 3橫空出世,已經(jīng)無(wú)限逼近這個(gè)預(yù)言。對(duì)于場(chǎng)上閉源大模型的玩家來(lái)說(shuō),必須得做到比最強(qiáng)開源大模型領(lǐng)先,才能證明自己的價(jià)值。   

而Llama 3這樣急速拉高開源模型水位線的做法,無(wú)疑是打在其他大模型企業(yè)腹地上一記又快又狠的重拳。

但對(duì)于AI應(yīng)用層的企業(yè)來(lái)說(shuō),“奶媽”Llama 3的表現(xiàn)著實(shí)讓人驚喜。獵豹CEO傅盛在凌晨?jī)牲c(diǎn)的視頻中提到,絕大多數(shù)的模型都是基于Llama重新訓(xùn)練或者進(jìn)行微調(diào)的,而最讓人驚喜的點(diǎn)就在于Llama 3沒有將目標(biāo)一味聚焦在“大”上,而是讓8B的小模型也跑出了強(qiáng)性能。

傅盛發(fā)布視頻截圖傅盛發(fā)布視頻截圖

小扎在訪談中提到無(wú)法讓人使用的AI與新技術(shù)的濫用一樣糟糕,因此“擁有一個(gè)優(yōu)秀且成為標(biāo)準(zhǔn)的開源人工智能,可能是緩解這種情況的最佳方法?!倍鳯lama 3的優(yōu)秀和強(qiáng)大,本身就是對(duì)“開源社區(qū)會(huì)越來(lái)越落后”論調(diào)的最強(qiáng)反擊。

AI技術(shù)想要服務(wù)于人類福祉,就需要更多人能伸手摘到這顆樹上的果實(shí)。Llama 3已經(jīng)來(lái)了,企業(yè)和研究機(jī)構(gòu)在強(qiáng)大底座上的二次開發(fā)和技術(shù)創(chuàng)新也就不遠(yuǎn)了。

參考鏈接:

1.https://www.youtube.com/watch?v=bc6uFV9CJGg

2.https://ai.meta.com/blog/meta-llama-3/?utm_source=twitter&utm_medium=organic_social&utm_cnotallow=video&utm_campaign=llama3

3.https://techcrunch.com/2024/04/18/meta-releases-llama-3-claims-its-among-the-best-open-models-available/

想了解更多AIGC的內(nèi)容,請(qǐng)?jiān)L問:

51CTO AI.x社區(qū)

http://www.sunluscious.com.cn/aigc/

責(zé)任編輯:武曉燕 來(lái)源: 51CTO技術(shù)棧
相關(guān)推薦

2024-04-19 09:17:33

AI模型

2023-09-11 15:57:16

人工智能模型GPT-4

2024-04-19 10:32:08

2023-09-07 13:25:00

AI模型

2013-09-10 15:06:30

2023-09-11 13:28:00

AI模型

2024-01-30 21:18:57

模型智能CMMLU

2024-05-09 08:33:33

2024-06-17 12:39:37

2024-04-19 07:55:57

Llama 3模型人工智能開源

2016-05-06 18:26:08

2025-04-08 02:26:00

2023-08-14 17:38:58

百度文心一言大模型評(píng)測(cè)

2023-08-27 14:44:04

代碼編程語(yǔ)言

2023-07-25 09:23:23

Llama 2GPT-4

2024-05-27 09:01:42

Llama 3大型語(yǔ)言模型人工智能

2023-10-21 12:42:06

數(shù)據(jù)模型

2024-04-23 13:37:00

數(shù)據(jù)訓(xùn)練

2023-10-11 13:09:52

訓(xùn)練模型

2023-08-25 13:12:59

AI開源
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲成a人v欧美综合天堂下载| 神马久久一区二区三区| 国产一区二区三区站长工具| 国产一区二区精品久久91| 91国偷自产一区二区三区观看| 欧美精品丝袜中出| 欧美日韩精品在线观看| 中文字幕大看焦在线看| 日韩影视精品| 欧美在线视频播放| 91在线视频观看免费| 国产成人福利夜色影视| 韩日av一区二区| 日韩一区二区影院| 国产亚洲一区二区三区在线播放| 中文字幕乱在线伦视频乱在线伦视频| 国内成人精品2018免费看| 92福利视频午夜1000合集在线观看| av色图一区| 91蝌蚪精品视频| 1024国产精品| 国产精品wwww| 骚视频在线观看| 欧美jizz| 欧美日韩国产中文| 欧美日韩一区二区三区在线视频| 爱爱爱免费视频在线观看| 欧美日韩网址| 亚洲综合成人婷婷小说| 亚洲人成电影网站| 中文字幕亚洲自拍| 国产又大又硬又粗| 九热爱视频精品视频| 色悠悠久久久久| 乱小说综合网站| 欧美少妇xxxx| 欧美性三三影院| 成人短视频在线看| 日本午夜精品久久久久| 精品久久久亚洲| 亚洲视频在线视频| 色天使色偷偷av一区二区| 日韩中文在线字幕| 亚洲视频国产精品| 精品国产999| 亚洲www在线| 成人在线免费观看91| 国产成人一区二区三区小说| 国产在线视频你懂得| 另类亚洲自拍| 亚洲情综合五月天| 毛片视频免费观看| 免费在线视频一级不卡| 黄色一级片网址| 亚洲自拍中文字幕| 992kp快乐看片永久免费网址| 成人午夜视屏| 国产亚洲欧美一区二区 | 欧美一区二区.| 欧美久久久久久蜜桃| 97视频在线免费播放| 日韩激情图片| 国产日韩欧美一区在线| 99久久er热在这里只有精品15| 欧美成人精品激情在线观看| 日韩欧美亚洲| 五月综合激情日本mⅴ| 免费在线国产| 欧美精品一级二级| 福利视频网站| 欧美激情偷拍| 欧美中文字幕一区二区| 韩日欧美一区二区| 国产在线观看免费| 欧美日韩国产一二三| 春色校园综合激情亚洲| 亚洲精品欧美综合四区| www.欧美精品| 免费资源在线观看| 日韩免费性生活视频播放| 午夜免费福利在线| 免费精品99久久国产综合精品| 欧美性受xxxx白人性爽| 日韩欧美精品一区| 亚州欧美一区三区三区在线| 日韩免费特黄一二三区| 久久亚洲免费| 五月精品视频| 51色欧美片视频在线观看| 久久久国产精品| 97视频免费看| 亚洲久久一区| 91精品久久久久久久久青青| 欧美羞羞视频| 日韩一级黄色片| 成人亚洲视频| 亚洲aⅴ日韩av电影在线观看| 蓝色福利精品导航| 国内一区二区三区在线视频| 青娱乐极品盛宴一区二区| 国产成人鲁鲁免费视频a| 一区二区三区四区五区精品视频 | 日本丰满大乳奶| 中文乱码免费一区二区| 中文字幕欧美人与畜| 亚洲精品人人| 美女喷白浆视频| 欧美一区二区视频在线观看 | 亚洲综合精品| 亚洲一区二区三区视频| 久久99久久99小草精品免视看| 国产精品久久久久久久小唯西川| 视频一区中文| 国产又粗又长又爽视频| 色婷婷激情一区二区三区| 亚洲精品视频区| 一区二区三区精品视频在线| 浓精h攵女乱爱av| 欧美一区二区三区在| 亚洲区小说区| 国产精品高潮粉嫩av| 韩国成人精品a∨在线观看| 三级在线观看| 欧美性大战久久久久久久蜜臀| 久久亚洲精品人成综合网| 一区二区三区视频观看| 久久毛片亚洲| 国产精品免费观看高清| 欧美—级在线免费片| 色婷婷亚洲十月十月色天| www精品美女久久久tv| 欧美一级视频免费看| 国内成人精品2018免费看| 夜色福利资源站www国产在线视频| 亚洲精品国产一区二区精华液| 亚洲成a人片| 日韩黄色影视| 欧美日韩中文一区| 天堂8中文在线| 亚洲国产精品美女| 欧美123区| 久久久国产视频91| 久久男人av| 国产成人福利网站| 国产亚洲女人久久久久毛片| 人人干人人视频| 亚洲一区免费视频| 免费在线黄色网址| 国产成人久久久精品一区| 国产精品久久久久久久久久免费看 | 中文字幕欧美日韩一区二区| 在线观看成人免费视频| 日本三级在线观看网站| 国产伦精品一区二区三区四区视频| 怡红院av一区二区三区| 欧美挤奶吃奶水xxxxx| 91成人免费视频| 久久99久久久久久久久久久| 春暖花开成人亚洲区| 亚洲xxxxx电影| 在线精品观看国产| 99精品国产99久久久久久福利| 日本福利片高清在线观看| 91久久夜色精品国产网站| 免费久久99精品国产| 麻豆tv在线| 日韩中文第一页| 成人午夜视频网站| 国产午夜在线| 欧美白人最猛性xxxxx69交| 国产日韩一区二区三免费高清| 国产成人久久久| 亚洲高清免费在线| sqte在线播放| 色综久久综合桃花网| 成人精品视频.| 一区二区三区视频国产日韩| 国产精品久久久久久久久久久久久久| 91精品天堂福利在线观看 | 男人揉女人奶房视频60分 | 阳光姐妹淘韩国版| 成人免费福利在线| 欧美日本一区二区三区| 日韩中文字幕91| 黄色三级电影网站| 91欧美视频网站| 欧美一级午夜免费电影| 精品一区精品二区高清| 国产麻豆精品| 羞羞视频在线免费看| 日本一区免费在线观看| 色狠狠av一区二区三区香蕉蜜桃| 中文av字幕一区| 欧美色综合网| 亚洲精品中文字幕| 国产原创欧美精品| 99精品欧美一区二区三区小说| 韩国女主播一区二区三区| 视频一区二区在线播放| 免费成人进口网站|