国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Llama 4訓(xùn)練作弊爆出驚天丑聞!AI大佬憤而辭職,代碼實測崩盤全網(wǎng)炸鍋

人工智能 新聞
Llama 4本該是AI圈的焦點,卻成了大型翻車現(xiàn)場。開源首日,全網(wǎng)實測代碼能力崩盤。更讓人震驚的是,模型訓(xùn)練測試集被曝作弊,內(nèi)部員工直接請辭。

Meta前腳剛發(fā)Llama 4,后腳就有大佬請辭了!

一畝三分地的爆料貼稱,經(jīng)過反復(fù)訓(xùn)練后,Llama 4未能取得SOTA,甚至與頂尖大模型實力懸殊。

為了蒙混過關(guān),高層甚至建議:

在后訓(xùn)練階段中,將多個benchmark測試集混入訓(xùn)練數(shù)據(jù)。

在后訓(xùn)練階段中,將多個benchmark測試集混入訓(xùn)練數(shù)據(jù)。

最終目的,讓模型短期提升指標(biāo),拿出來可以看起來不錯的結(jié)果。

圖片

這位內(nèi)部員工@dliudliu表示,「自己根本無法接受這種做法,甚至辭職信中明確要求——不要在Llama 4技術(shù)報告中掛名」。

另一方面,小扎給全員下了「死令」——4月底是Llama 4交付最后期限。

在一系列高壓之下,已有高管提出了辭職。

其實,Llama 4昨天開源之后,并沒有在業(yè)內(nèi)得到好評。全網(wǎng)測試中,代碼能力極差,實力不如GPT-4o。

網(wǎng)友Flavio Adamo使用相同的提示詞,分別讓Llama 4 Maveric和GPT-4o制作一個旋轉(zhuǎn)多邊形的動畫。

圖片

可以看出,Llama 4 Maveric生成的多邊形并不規(guī)則而且沒有開口。小球也不符合物理規(guī)律,直接穿過多邊形掉下去了。

相比之下GPT-4o制作的動畫雖然也不完美,但至少要好得多。

甚至,有人直接曝出,Llama 4在LMarena上存在過擬合現(xiàn)象,有極大的「作弊」嫌疑。

圖片

圖片

而如今,內(nèi)部員工爆料,進一步證實了網(wǎng)友的猜想。

沃頓商學(xué)院教授Ethan Mollick一語中的,「如果你經(jīng)常使用 AI 模型,不難分辨出哪些是針對基準(zhǔn)測試進行優(yōu)化的,哪些是真正的重大進步」。

圖片

不過,另一位內(nèi)部員工稱,并沒有遇到這類情況,不如讓子彈飛一會兒。

圖片

內(nèi)部員工爆料,Llama 4訓(xùn)練作弊?

幾位AI研究人員在社交媒體上都「吐槽」同一個問題,Meta在其公告中提到LM Arena上的Maverick是一個「實驗性的聊天版本」。

圖片

如果看得仔細一點,在Llama官網(wǎng)的性能對比測試圖的最下面一行,寫著「Llama 4 Maverick optimized for conversationality.」

翻譯過來就是「針對對話優(yōu)化的Llama 4 Maverick」——似乎有些「雞賊」。

圖片

這種「區(qū)別對待」的會讓開發(fā)人員很難準(zhǔn)確預(yù)測該模型在特定上下文中的表現(xiàn)。

AI的研究人員觀察到可公開下載的Maverick與LM Arena上托管的模型在行為上存在顯著差異。

圖片

而就在今天上午,已經(jīng)有人爆料Llama 4的訓(xùn)練過程存在嚴(yán)重問題!

即Llama 4內(nèi)部訓(xùn)練多次仍然沒有達到開源SOTA基準(zhǔn)。

Meta的領(lǐng)導(dǎo)層決定在后訓(xùn)練過程中混合各種基準(zhǔn)測試集——讓Llama 4「背題」以期望在測試中取得「好成績」。

圖片

這個爆料的原始來源是「一畝三分地」,根據(jù)對話,爆料者很可能來自于Meta公司內(nèi)部。

圖片

對話中提到的Meta AI研究部副總裁Joelle Pineau也申請了5月底辭職。(不過,也有網(wǎng)友稱并非是與Llama4相關(guān))

圖片

但是根據(jù)Meta的組織架構(gòu)體系,Pineau是FAIR的副總裁,而FAIR實際上是Meta內(nèi)部與GenAI完全獨立的組織,GenAI才是負責(zé)Llama項目的組織。

圖片

GenAI的副總裁是Ahmad Al-Dahle,他并沒有辭職。

圖片

Llama 4才剛剛發(fā)布一天,就出現(xiàn)如此重磅的消息,讓未來顯得撲朔迷離。

代碼翻車,網(wǎng)友大失所望

在昨天網(wǎng)友的實測中,評論還是有好有壞。

但是過去一天進行更多的測試后,更多的網(wǎng)友表達了對Llama 4的不滿。

在Dr_Karminski的一篇熱帖中,他說Llama-4-Maverick——總參數(shù)402B的模型——在編碼能力方面大致只能與 Qwen-QwQ-32B相當(dāng)。

Llama-4-Scout——總參數(shù)109B的模型——大概與Grok-2或Ernie 4.5類似。

圖片

圖片

在評論中,網(wǎng)友響應(yīng)了這個判斷。

有人說Llama 4的表現(xiàn)比Gemma 3 27B還要差。

圖片

有人認為Llama 4的表現(xiàn)甚至和Llama 3.2一樣沒有任何進步,也無法完成寫詩。

圖片

其他用戶在測試后也表達了同樣的觀點,Llama 4有點不符合預(yù)期。

圖片

網(wǎng)友Deedy也表達了對Llama 4的失望,稱其為「一個糟糕的編程模型」。

他表示,Scout (109B) 和Maverick (402B)在針對編程任務(wù)的Kscores基準(zhǔn)測試中表現(xiàn)不如4o、Gemini Flash、Grok 3、DeepSeek V3和Sonnet 3.5/7。

圖片

他還給出了貼出了Llama 4兩個模型的一張測試排名,結(jié)果顯示這兩個新發(fā)布的模型遠遠沒有達到頂尖的性能。

圖片

網(wǎng)友anton說,Llama 4「真的有點令人失望」。

他表示自己不會用它來輔助編碼,而Llama 4的定位有點尷尬。

圖片

anton認為Llama 4的兩個模型太大了,不太好本地部署。他建議Meta應(yīng)該推出性能優(yōu)秀的小模型,而不是去追求成為SOTA。

「因為目前他們根本做不到?!顾麑懙馈?/span>

圖片

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-09-01 09:15:00

2023-12-25 07:50:22

2023-02-20 09:29:30

ChatGPTAI

2025-11-13 08:57:12

2025-05-19 08:57:00

2010-08-09 10:54:01

2025-03-11 13:54:11

2024-05-15 09:13:37

GPT-4oAI

2025-04-08 12:57:02

2025-04-07 09:20:00

AI模型訓(xùn)練

2025-04-16 09:30:16

2025-12-10 11:22:31

2022-05-09 14:41:45

蘋果離職

2025-09-12 11:00:09

2009-03-30 13:36:43

2025-11-03 09:09:00

2025-04-08 08:50:00

AI模型測試

2024-07-29 09:20:00

AI模型

2025-07-04 09:06:00

2018-03-29 09:22:06

Facebook數(shù)據(jù)app
點贊
收藏

51CTO技術(shù)棧公眾號

久久久久久18| 久久久久亚洲精品成人网小说| 老汉色影院首页| 欧美色图激情小说| 5566中文字幕一区二区电影| 97在线免费公开视频| 欧美午夜不卡| 91精品国产91久久久久福利| 亚洲第一图区| 亚洲日本在线天堂| 国产激情片在线观看| 黄色另类av| 热re91久久精品国99热蜜臀| 欧美xoxoxo| 欧美精品电影在线播放| 成人福利免费网站| www欧美成人18+| 亚洲国产另类久久久精品极度| 一区二区三区日本久久久| 一区二区三区视频免费在线观看 | 精品国产第一国产综合精品| 欧美日韩午夜在线| 欧美女同在线观看| 波多野结衣中文字幕一区| 日韩影片在线播放| 欧美特黄a级高清免费大片a级| 97婷婷涩涩精品一区| 播放一区二区| 欧美性受xxxx黑人xyx| 免费在线成人激情电影| 另类少妇人与禽zozz0性伦| 色婷婷精品大在线视频| jizz欧美激情18| 成人性视频网站| 一区二区不卡视频| 视频一区二区国产| 欧美久久久久久| 国产欧美一级| 免费a级在线播放| 韩日视频一区| 日韩视频一区二区三区| 免费h精品视频在线播放| 欧美一区二区三区爽大粗免费| 全色精品综合影院| 91九色精品| 中文字幕一区二区三区色视频| 久久久免费av| 欧美成年网站| 欧美大片欧美激情性色a∨久久| 欧美aaaaaa| 久久久在线免费观看| 久久资源综合| 91精品在线看| 在线亚洲伦理| 欧美日韩在线播放一区二区| 免费成人美女在线观看.| 一区高清视频| 成人网在线播放| www.欧美日本| 亚洲一二三区视频在线观看| 日韩欧美亚洲系列| 欧美一区二区三区小说| 国产一线二线在线观看| 亚洲深夜福利在线| 精品视频一区二区三区| 55夜色66夜色国产精品视频| 日本在线电影一区二区三区| 精品国产乱码久久久久软件 | 99三级在线| 国产农村妇女毛片精品久久莱园子| 欧美日韩精品综合| 国产一区二区三区日韩| 欧美视频综合| 黄页在线观看免费| 日韩中文字幕在线精品| 精品国产影院| 99理论电影网| 国产精品一级黄| 免费福利片在线观看| 欧洲av一区二区嗯嗯嗯啊| 99re99热| 最近2019中文字幕第三页视频| 在线视频精品| 国产免费一区二区三区视频| av一区二区三区四区| 久久久久网址| 亚洲性人人天天夜夜摸| 国产精品久久亚洲| 亚洲一区不卡| 成人羞羞视频免费看看| 国产一级网站视频在线| 亚洲国产精品热久久| www.成人网| 久久久久久久久一区| 91亚洲精品久久久蜜桃| 极品美乳网红视频免费在线观看| 亚洲视频在线免费看| 日韩精品免费| 97超碰免费观看| 亚洲免费观看高清完整版在线| 色的视频在线免费看| 久久久久久久久久久久av| 亚洲精品精选| 国产91色在线观看| 欧美日韩另类一区| 77成人影视| 亚洲精品国产系列| 成人精品一区二区三区中文字幕| av在线第一页| 无码专区aaaaaa免费视频| 亚洲精品乱码| 久久久av水蜜桃| 中文字幕在线亚洲精品| 成人黄色大片网站| 欧美午夜aaaaaa免费视频| 日本免费视频www| 青青草在线免费观看| 黄网视频在线观看| 特级黄色录像片| 日韩国产一区三区| 亚洲国产精品久久久男人的天堂| 国产精品性做久久久久久| 欧美成人亚洲| 五月国产精品| 久久亚洲中文字幕无码| 亚洲人成77777在线观看网| 伊人久久影院| 国产精品流白浆视频| 悠悠资源网久久精品| 91大神网址| 久久久久亚洲精品国产| 精品欧美国产一区二区三区| 欧美aaaaaaaa牛牛影院| 免费在线激情视频| 激情婷婷综合| 亚洲成人一区在线| 天堂av在线网| av在线免费观看国产| 亚洲一区二区av在线| 日韩一区二区三区四区五区 | 国产精品黄色片| 国产精品旅馆在线| 亚洲国产一区二区三区| 国产精品久久观看| 欧美人成在线| 久久综合精品国产一区二区三区| 欧美精品一区二区三区蜜臀| 欧美午夜电影在线| www.日韩大片| 国产成人av一区二区三区在线 | 中文字幕国产亚洲| 欧美激情在线视频二区| 99久久久无码国产精品| 日韩aaaa| 久久天天久久| 欧美另类videos| 欧美专区国产专区| 欧美日韩国产一二三| 国产精品萝li| 亚洲人成伊人成综合网小说| 亚洲一卡二卡三卡四卡无卡久久| 亚洲精品免费一二三区| 91国产丝袜在线播放| 久草视频视频在线播放| 免费看一级大黄情大片| 佐山爱痴汉视频一区二区三区 | 欧美精品一区二区久久| 国自产拍偷拍福利精品免费一 | 成人在线分类| 99re热在线观看| 欧美精品在线观看播放| 国产精品一品二品| 欧美97人人模人人爽人人喊视频| 国产一区二区三区无遮挡| 欧美日韩免费在线| 国内精品伊人久久久久av影院 | 色老头在线观看| 亚洲嫩模很污视频| 在线视频中文亚洲| 中文字幕一区二区三区乱码在线 | 成人国产视频在线| 自拍偷拍亚洲色图欧美| 国产高清www| 免费高清成人| 婷婷色在线资源| 中文字幕亚洲精品乱码 | 日本无删减在线| 粉嫩一区二区三区在线观看| 成人在线视频免费观看| 国产成人在线视频播放| 午夜久久久久久久久| 日韩二区三区在线| 精品国产aⅴ麻豆| 国产大学生校花援交在线播放| 日韩欧美一级| 色777狠狠狠综合伊人| 国产一区在线观看视频| 日韩精品视频在线免费观看 | 欧美资源在线观看| 欧美午夜丰满在线18影院|