国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

開源大模型超越GPT-3.5!爆火MoE實測結果出爐,網友:OpenAI越來越沒護城河了

人工智能 新聞
首個開源MoE大模型Mixtral 8x7B,已經達到甚至超越了Llama 2 70B和GPT-3.5的水平。

一條神秘磁力鏈接引爆整個AI圈,現在,正式測評結果終于來了:

首個開源MoE大模型Mixtral 8x7B,已經達到甚至超越了Llama 2 70B和GPT-3.5的水平。

(對,就是傳聞中GPT-4的同款方案。)

圖片

并且由于是稀疏模型,處理每個token僅用了12.9B參數就做到了這般成績,其推理速度和成本也與12.9B的密集模型相當。

消息一出,再次在社交媒體上掀起討論熱潮。

圖片

OpenAI創始成員Andrej Karpathy第一時間趕到現場整理起了筆記,還高亮出了重點:這家“歐版OpenAI”透露出的最強模型,還只是“中杯”。

p.s. Mixtral 8×7B甚至只是小杯……

圖片

英偉達AI科學家Jim Fan則贊說:

每個月都會有十幾個新的模型冒出來,但真正能經得住檢驗的卻寥寥無幾,能引發大家伙熱烈關注的就更少了。

圖片

并且這波啊,不僅是模型背后公司Mistral AI大受關注,也帶動MoE(Mixture of Experts)再次成為開源AI社區的最火議題。

HuggingFace官方就趁熱發布了一篇MoE的解析博文,同樣打出了“轉發如潮”的效果。

圖片

值得關注的是,Mistral AI的最新估值已經沖破20億美元,在短短6個月中增長了7倍多……

基本超越Llama 2 70B

說起來,Mistral AI這家公司也是不走尋常路。隔壁大廠前腳剛轟轟烈烈搞發布會,慢慢悠悠發模型,他們可倒好,直接來了個程序顛倒:

先甩鏈接開放下載,又給vLLM項目(一個大模型推理加速工具)提了PR,最后才想起來發布技術博客給自家模型整了個正經官宣。

圖片

△模型一開始是醬嬸發布的

那么還是先來看看,官方給出了哪些信息,與這兩天吃瓜群眾自己扒出來的細節有何不同。

首先,官方自信地表示:

Mixtral 8×7B在大多數基準測試中都優于Llama 2 70B,推理速度快了6倍。

它是最強大的、具有寬松許可的開放權重模型,也是最佳性價比之選。

具體來說,Mixtral采用了稀疏混合專家網絡,是一個decoder-only的模型。在其中,前饋塊會從8組不同的參數組中進行選擇——

也就是說,實際上,Mixtral 8×7B并不是8個7B參數模型的集合,僅僅是Transformer中的前饋塊有不同的8份。

這也就是為什么Mixtral的參數量并不是56B,而是46.7B。

其特點包括以下幾個方面:

  • 在大多數基準測試中表現優于Llama 2 70B,甚至足以擊敗GPT-3.5
  • 上下文窗口為32k
  • 可以處理英語、法語、意大利語、德語和西班牙語
  • 在代碼生成方面表現優異
  • 遵循Apache 2.0許可(免費商用)

具體測試結果如下:

圖片

另外,在幻覺問題方面,Mixtral的表現也由于Llama 2 70B:

在TruthfulQA基準上的成績是73.9% vs 50.2%;在BBQ基準上呈現更少的偏見;在BOLD上,Mixtral顯示出比Llama 2更積極的情緒。

此次與Mixtral 8×7B基礎版本一起發布的,還有Mixtral 8x7B Instruct版本。后者經過SFT和DPO優化,在MT-Bench上拿到了8.3的分數,跟GPT-3.5差不多,優于其他開源大模型。

圖片

目前,Mistral官方已經宣布上線API服務,不過還是邀請制,未受邀用戶需要排隊等待。

圖片

值得關注的是,API分為三個版本:

  • 小小杯(Mistral-tiny),對應模型是Mistral 7B Instruct;
  • 小杯(Mistral-small),對應模型是這次發布的Mixtral 8×7B;
  • 中杯(Mistral-medium),對應的模型尚未公布,但官方透露其在MT-Bench上的得分為8.6分。

有網友直接把GPT-4拉過來對比了一下。可以看到,中杯模型在WinoGrande(常識推理基準)上的得分超過了GPT-4。

圖片

價格方面,小小杯到中杯的輸入和輸出價格分別是每一百萬token0.14~2.5歐元和0.42~7.5歐元不等,嵌入模型則是0.1歐元每百萬token(1歐元約合7.7人民幣)

圖片

而在線版本,目前還只能到第三方平臺(Poe、HuggingFace等)體驗。

能看懂中文,但不太愿意說

雖然官方通告中并沒有說支持中文,但我們實測(HuggingFace Chat中的在線版,模型為Instruct版本)發現,Mixtral至少在理解層面上已經具備一定中文能力了。

生成層面上,Mixtral不太傾向于用中文來回答,但如果指明的話也能得到中文回復,不過還是有些中英混雜的情況。

面對更多的“弱智吧”問題,Mixtral的回答雖中規中矩,但看上去至少已經理解了字面含義。

數學方面,面對經典的雞兔同籠問題,Mixtral的回答從過程到結果都完全正確。

圖片

即使是高等數學問題,比如復雜的函數求導,Mixtral也能給出正確答案,更難能可貴的是過程沒什么問題。

圖片

而此次的官方通告中專門強調了Mixtral的代碼能力很強,所以也受到了我們的重點考察。

一道困難難度的LeetCode下來,Mixtral給出的代碼一次就通過了測試。

給你一個未排序的整數數組nums,請你找出其中沒有出現的最小的正整數。
請你實現時間復雜度為O(n)并且只使用常數級別額外空間的解決方案。

圖片

但隨著我們繼續提問,Mixtral的回答一不小心暴露了自己可能專門針對LeetCode做過訓練,而且還是中文版LC。

圖片

為了更加真實地展示Mixtral的代碼能力,我們轉而讓它編寫實用程序——用JS寫一個Web版計算器。

經過幾輪調整之后,雖然按鈕的布局有些奇怪,但基本的四則運算已經可以完成了。

圖片

此外我們會發現,如果在同一個對話窗口中不斷補充新的要求,Mixtral的表現可能會有所下降,出現代碼格式混亂等問題,開啟新一輪對話后則會恢復正常。

圖片

除了API和在線版本,Mistral AI還提供了模型下載服務,可以用??上的磁力鏈接或通過Hugging Face下載之后在本地部署。

在??上,已經有不少網友在自己的設備上跑起了Mixtral,還給出了性能數據。

在128GB內存的蘋果M3 Max設備上,使用16位浮點精度運行Mixtral時消耗了87GB顯存,每秒可以跑13個token。

圖片

同時也有網友在M2 Ultra上通過llama.cpp跑出了每秒52token的速度。

圖片

看到這里,你會給Mistral AI的模型實力打幾分?

不少網友是已經興奮起來了:

“OpenAI沒有護城河”,看起來肯定會成為現實……

圖片

要知道,Mistral AI今年5月才剛剛成立。

短短半年,已是一手20億美元估值,一手驚艷整個AI社區的模型。

更關鍵的是,普林斯頓博士生Tianle Cai分析了Mistral-7B與Mixtral-8x7B模型的權重相關性做了分析,證明了模型的成功復用。

隨后網友發現,Mistral AI創始人也親自證實,MoE模型確實就是把7B基礎模型復制8次,再進一步訓練來的。

圖片

隨著此類模型的免費商用,整個開源社區、新的創業公司都可以在此基礎之上推動MoE大模型的發展,就像Llama已然帶動的風暴那樣。


責任編輯:張燕妮 來源: 量子位
相關推薦

2023-04-28 09:07:28

2024-04-23 13:10:41

數據訓練

2023-12-12 13:57:00

GPT-3.5MistralAI

2024-07-19 09:26:12

2024-05-10 12:58:08

2023-02-16 13:48:56

模型論文

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-10-16 13:28:00

數據AI

2024-02-04 13:56:03

2023-07-22 13:09:51

模型開源

2018-03-29 14:51:59

智能公廁AI

2023-05-05 13:14:28

谷歌AI

2023-05-16 20:47:38

2023-12-11 19:08:59

AI模型

2023-07-10 15:22:29

OpenAIGPT-3.5

2023-09-18 16:24:33

數據研究

2025-08-12 04:00:00

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2025-03-03 08:00:00

OpenAI模型AI

2023-06-21 13:37:41

模型研究
點贊
收藏

51CTO技術棧公眾號

亚洲第一精品福利| 7777精品久久久大香线蕉| 91在线观看视频| 婷婷久久伊人| 欧美一区二区三| 99热久久这里只有精品| 日韩美女天天操| 国产精品v一区二区三区 | 这里只有精品免费| 天天综合久久| 欧美1819sex性处18免费| 午夜精品一区二区三区三上悠亚| 91p九色成人| 欧美国产视频一区| 亚洲电影在线看| 老牛影视一区二区三区| 成人在线二区| 精品乱码一区| 色综合一区二区| 欧美日韩视频| av老司机免费在线| 日本精品久久久久久久| 欧美亚洲在线日韩| 成人亚洲精品777777大片| 久久的精品视频| 久久久久久久久久久黄色| 丁香综合av| 伊人网在线观看| 国产亚洲福利社区| 无码av免费一区二区三区试看| 琪琪久久久久日韩精品| 国外av网站| 国产日韩欧美日韩| 亚洲女同ⅹxx女同tv| 久久国产电影| www免费在线观看视频| 欧美黄色三级网站| 亚洲男人的天堂网| 精品国产a一区二区三区v免费| 黑粗硬长欧美在线视频免费的| 国产主播在线一区| 日韩高清不卡av| 亚洲国产精品天堂| 国产激情91久久精品导航| 91精品精品| 久久av综合| 一区二区传媒有限公司| 国产视频精品自拍| 91久久久精品国产| 中文字幕中文字幕在线中文字幕三区 | 黄视频网站在线观看| 日本一区免费| 欧美一区二区在线观看| 尤物网精品视频| av女优在线| 亚洲制服中文| 亚洲精品一区二区三区不| 99久久久久久| 色综合视频在线观看| 超碰在线一区| 亚洲人成网站在线| 台湾佬综合网| 日本最黄视频| 国产精品视频区| 欧美性猛交xxxxx免费看| 网红女主播少妇精品视频| 国产淫片av片久久久久久| 国内精品免费午夜毛片| 亚洲欧美激情在线| 亚洲精品一区二区妖精| 在线观看的av网站| 成人欧美一区二区三区视频xxx| 欧美成人艳星乳罩| 99精品视频一区二区| 成人在线视频中文字幕| 日本福利小视频| 91九色国产视频| 欧美一区二区国产| 2024国产精品| 国模 一区 二区 三区| 国产成人a视频高清在线观看| 久久9精品区-无套内射无码| 91超碰中文字幕久久精品| 欧美日韩国产在线看| 高潮精品一区videoshd| 欧美福利影院| 国产第一亚洲| 日本aⅴ中文| 国产欧美日韩小视频| 欧美最猛性xxxx| 一本一本久久a久久精品综合小说| 久久亚洲综合色一区二区三区| 亚洲茄子视频| 欧美gvvideo网站| 91成人app| 999av小视频在线| 宅男深夜国产| 亚洲一区二区三区加勒比| 成人激情在线播放| 欧美在线性爱视频| 精品国产欧美一区二区三区成人 | 日本国产精品| 日产精品一区| 免费av不卡在线观看| 2024最新电影免费在线观看 | 精品久久人人做人人爱| 亚洲不卡一区二区三区| 亚洲国产精品99久久久久久久久| 国产精品一区二区不卡| 狠狠综合久久| 日韩av在线播放网址| 超碰成人在线观看| 激情综合婷婷| 欧美天堂一区二区| 动漫一区二区| 69堂免费精品视频在线播放| 超碰国产精品一区二页| www.爱久久| 成人影院网站ww555久久精品| 中文在线а√天堂| 国产偷人视频免费| 国产精品美女黄网| 蜜臀av免费一区二区三区| 色婷婷综合久久久久中文一区二区 | 国产在线高清理伦片a| 成人免费毛片片v| 亚洲精品亚洲人成在线观看| 一二三四视频在线中文| gogogo高清在线观看免费完整版| 久久精品.com| 久久久国产精品一区二区三区| www.色综合| 日韩资源av在线| 99热99精品| 综合在线一区| 欧美成人午夜77777| 国产在线看片免费视频在线观看| 欧洲在线视频| 免费视频观看成人| 精品九九在线| 在线视频日韩| 噜噜噜在线观看免费视频日韩| 免费在线欧美黄色| 国产精品每日更新在线播放网址| 在线视频一区观看| 久久国产情侣| 狠狠干五月天| 337p亚洲精品色噜噜噜| 久88久久88久久久| 久久动漫网址| 久操视频在线| 国产在线观看福利| 亚洲a成v人在线观看| 精品美女一区二区三区| av不卡在线观看| 香蕉视频官网在线观看日本一区二区| 国产黄大片在线观看| 啦啦啦中文高清在线视频| 日产精品高清视频免费| 1769国产精品| 亚洲成av人片在线观看香蕉| 亚洲天堂av一区| 蜜桃av一区二区在线观看 | 精品国产一区二区三区不卡| 国产精品免费aⅴ片在线观看| 先锋影音国产一区| 狼人精品一区二区三区在线| 美洲精品一卡2卡三卡4卡四卡| 成人女性文胸| 91成人在线视频观看| 91精品婷婷国产综合久久蝌蚪| 夜夜嗨av一区二区三区免费区| 色狠狠色狠狠综合| 国产精品不卡一区二区三区| 噜噜噜91成人网| 欧美日韩精品在线一区| 欧洲成人一区| 日韩中文字幕精品| 欧美一区二区三区啪啪| 亚洲一区在线观看网站| 99久久精品费精品国产一区二区| 国产精品美女久久久| 国产伦精品一区二区三区视频| 国产精品美女午夜爽爽| 亚洲免费在线看| 国产一区二区三区探花| 日韩网站中文字幕| 可以在线观看的av网站| 亚洲 欧美 日韩系列| 一级日韩一区在线观看| 91久久国产自产拍夜夜嗨| 欧美激情中文网| 亚洲奶大毛多的老太婆| 欧美精品久久久久久久久老牛影院| 国产精品电影一区二区| 成人91在线观看| 美女诱惑一区二区| 激情综合电影网| 99久久九九| 蜜桃国内精品久久久久软件9|