国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

數(shù)學(xué)能力超ChatGPT,70B開(kāi)源大模型火了:用AI微調(diào)AI,微軟全華班出品

人工智能
OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù),一部分原因是使用了真實(shí)人類用戶生成的開(kāi)放域指令數(shù)據(jù)進(jìn)行了微調(diào)。

用AI生成的指令微調(diào)羊駝大模型,數(shù)學(xué)能力超ChatGPT——

微軟最新開(kāi)源大模型WizardMath來(lái)了。

圖片

如下圖所示,經(jīng)過(guò)GSM8k數(shù)據(jù)集測(cè)試,WizardMath數(shù)學(xué)能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——

并且是在參數(shù)只有700億,遠(yuǎn)不及后三者的情況之下。

圖片

HuggingFace已上線3個(gè)在線可玩版本(分別為7B、13B和70B參數(shù)),各種數(shù)學(xué)題可以直接丟進(jìn)去試一試。

比如解決下面這道四次多項(xiàng)式方程:

圖片

或者是一道簡(jiǎn)單的微積分:

圖片

亦或者是稍微修改過(guò)的拉格朗日方程推導(dǎo):

圖片

它都全部正確(過(guò)程也不需要等太久)

有網(wǎng)友向作者表示:

效果真的很驚人,感謝你們對(duì)開(kāi)源LLM的貢獻(xiàn)。

圖片

目前,相關(guān)代碼、復(fù)現(xiàn)方式以及論文也都開(kāi)源或上線,GitHub短短幾天已攬獲4.8k標(biāo)星

圖片

那么,WizardMath究竟是如何做到的?

用AI生成的指令增強(qiáng)大模型能力

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù),一部分原因是使用了真實(shí)人類用戶生成的開(kāi)放域指令數(shù)據(jù)進(jìn)行了微調(diào)。

然而,不是誰(shuí)都能像這家公司一樣獲得這樣的指令數(shù)據(jù)集。

一是因?yàn)檎麄€(gè)注釋過(guò)程極其昂貴且耗時(shí),二是人工難以創(chuàng)建出足夠比例的高難度指令。

因此,開(kāi)發(fā)出一種成本相對(duì)較低的、大規(guī)模開(kāi)放域指令自動(dòng)生產(chǎn)方法,成為當(dāng)下指令調(diào)優(yōu)語(yǔ)言模型的關(guān)鍵。

在此,作者將他們的方法命名為Evol Instruction。

它是一種利用AI來(lái)代替人類自動(dòng)生成涵蓋各種難度級(jí)別開(kāi)放域指令的新方法。

具體而言,Evol Instruction分為指令進(jìn)化器和指令消除器。

其中指令進(jìn)化器可通過(guò)深度進(jìn)化(藍(lán)線)或廣度進(jìn)化(紅線)兩種路徑,將簡(jiǎn)單指令升級(jí)為更復(fù)雜的指令或創(chuàng)建一條全新指令。

具體執(zhí)行哪一條?隨機(jī)選擇就好。

圖片

其中,深度進(jìn)化的具體“進(jìn)化法”,則是通過(guò)五種類型的操作來(lái)完成,包括:

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復(fù)雜化(complicate input)

由于所有指令均由AI完成,有時(shí)難免會(huì)出現(xiàn)錯(cuò)誤。因此,指令消除器就是用于過(guò)濾失敗指令的。

以下是一個(gè)具體示例,該方法從“1+1=?”開(kāi)始,最終通過(guò)以上步驟自動(dòng)生成了相當(dāng)多的新指令。

圖片

通過(guò)重復(fù)這一生成過(guò)程,最終我們就能得到足夠多的指令,然后將它們合并并隨機(jī)打亂,組成一個(gè)難度級(jí)別均勻分布的指令集,就可以對(duì)基礎(chǔ)大模型進(jìn)行微調(diào)了。

在此,作者選擇Alpaca的訓(xùn)練數(shù)據(jù)(僅由175條人工創(chuàng)建的種子指令生成)作為初始數(shù)據(jù)集,然后使用ChatGPT的API執(zhí)行了四個(gè)進(jìn)化周期,最終獲得25萬(wàn)條指令。

為了與Vicuna的70k真實(shí)用戶數(shù)據(jù)(ShareGPT)進(jìn)行公平比較,作者從這25萬(wàn)條數(shù)據(jù)中抽取了等量的樣本,訓(xùn)練LLaMA 7B模型,最終得到WizardLM,結(jié)果WizardLM的性能明顯優(yōu)于Vicuna。

(Alpaca:斯坦福在LLaMa-7B基礎(chǔ)上微調(diào)出來(lái)的模型;Vicuna,UC伯克利在LLaMa-13B的基礎(chǔ)上微調(diào)得來(lái))

此外,在更為復(fù)雜的測(cè)試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復(fù)雜指令的能力。

基于此,作者又利用Evol Instruction生成了很多數(shù)學(xué)領(lǐng)域相關(guān)的指令,然后微調(diào)羊駝大模型,得到了WizardMath。

其效果如開(kāi)頭所示,在GSM8k數(shù)據(jù)集上測(cè)得其數(shù)學(xué)能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數(shù)的Flan-PaLM 2之后。

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。

圖片

團(tuán)隊(duì)介紹

本文共9位作者,全華人。

一作有3位:

Can Xu,微軟亞洲互聯(lián)網(wǎng)工程院S+D NLP組高級(jí)應(yīng)用科學(xué)家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機(jī)器人系統(tǒng)工作。

Qingfeng Sun, Microsoft Research科學(xué)家,研究方向?yàn)樽匀徽Z(yǔ)言處理和信息檢索,精通構(gòu)建高效搜索系統(tǒng),為Microsoft Bing和Office 365貢獻(xiàn)了核心深度模型。

Kai Zheng,Microsoft Research科學(xué)家,研究方向?yàn)樽匀徽Z(yǔ)言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻(xiàn)了核心深度模型。

圖片

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學(xué)家,在微軟工作16年有余、曾作為微軟必應(yīng)搜索引擎和Cortana智能助手自然語(yǔ)言理解負(fù)責(zé)人,日前已被曝離職投身大模型創(chuàng)業(yè)。

另還有一位作者Jiazhan Feng,是北大學(xué)生,這篇合著論文是TA在微軟實(shí)習(xí)時(shí)產(chǎn)出的。

項(xiàng)目主頁(yè): https://github.com/nlpxucan/WizardLM/tree/main/WizardMath。

論文地址:https://arxiv.org/abs/2304.12244(WizardLM)https://arxiv.org/abs/2306.08568(WizardCoder)。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2025-07-04 09:06:00

2023-08-18 14:34:00

研究模型

2024-07-02 09:20:59

2025-01-10 14:15:02

2024-05-30 12:50:05

2023-05-16 13:54:00

模型AI

2023-08-21 10:20:03

開(kāi)源模型

2023-05-12 13:14:59

ChatGPTAI工具

2024-06-19 13:02:01

2024-05-09 08:33:33

2024-10-25 14:30:00

模型AI

2023-10-09 12:36:08

人工智能數(shù)據(jù)

2024-09-09 08:50:00

2023-03-30 13:30:21

2025-01-08 09:30:00

Meta大模型訓(xùn)練

2025-03-11 09:35:00

2025-01-17 13:53:11

AI大模型檢測(cè)工具

2024-09-14 09:31:00

2023-11-13 19:35:12

訓(xùn)練數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲一区免费看| 欧美成人r级一区二区三区| 国内精品伊人久久久久av影院| 日日夜夜精品视频免费| 国产伦精品一区二区三区视频青涩| 免费久久99精品国产自在现线| 国产精品91一区二区三区| 欧美性生活一区| 亚洲色图25p| 国产奶头好大揉着好爽视频| 国产a级网站| 国产一区二区高清| 555www成人网| 国产精品66| 日韩欧美国产综合| 欧美写真视频一区| 久久蜜桃香蕉精品一区二区三区| 久久精品一二三区| 99久久久久国产精品| 欧美日韩福利在线观看| 免费在线看污片| 欧美日韩一区二区在线观看视频| 特级毛片在线观看| 欧美韩国日本不卡| 黄色www网站| 国产在线观看一区二区| 精品免费日产一区一区三区免费| 国产精品久久久久无码av| 欧美性在线观看| 国产综合色在线观看| 日韩免费视频线观看| 亚洲国产免费av| 精品无人乱码| 欧美在线亚洲在线| 欧美日韩激情在线一区二区三区| 日本一区二区三区视频在线看 | 国产精品中文在线| 欧美日韩卡一| 亚洲毛片在线观看.| 波多野结衣在线播放| 91精品国产综合久久精品图片 | 久久精品人人做人人爽| 色老头在线一区二区三区| 日韩欧美一级特黄在线播放| 久操视频在线观看| 色综合久久88色综合天天6| 香蕉网站在线| 欧美专区日韩专区| 九九热视频在线观看| 欧美视频一区二区在线观看| 香蕉视频网站在线观看| 在线成人av影院| 黄色污污视频在线观看| 精品亚洲精品福利线在观看| 中文在线8资源库| 一区二区三区日韩在线| 电影中文字幕一区二区| 久久久久久久一| 欧美日本成人| 成人三级视频在线观看一区二区| 激情丁香综合| 亚洲一区二区三区四区中文| 国产乱妇无码大片在线观看| www.com毛片| 亚洲精品国产高清久久伦理二区| 久久久亚洲精华液精华液精华液| 欧美午夜精品电影| 欧亚av在线| 色综合男人天堂| 999成人网| 亚洲aⅴ天堂av在线电影软件| 高清国产一区二区| free亚洲| 欧美日韩中字一区| 国产精品成人国产| 国产精品自拍网| 蜜臀av亚洲一区中文字幕| 99精品人妻少妇一区二区| 亚洲精品国产视频| 国产精品va在线| 成人免费毛片a| 天天夜碰日日摸日日澡性色av| 一区二区三区免费网站| 91社区在线观看| 日韩大片免费观看视频播放| 日本免费高清视频| 久久久精品综合| 亚洲7777| 成人综合婷婷国产精品久久蜜臀 | 牛牛国产精品| 欧美一区激情视频在线观看| 国产人妖一区| 欧美日韩国产综合一区二区 | 一二三区精品福利视频| 日本高清一区| 欧美乱熟臀69xxxxxx| 在线播放你懂得| 亚洲深夜福利视频| 久久高清免费| 日韩免费毛片| 亚洲图片欧美综合| 日本在线成人| 久久久久久久久久久久久久一区 | 欧美日韩在线网站| 成年人免费在线播放| 亚洲大胆美女视频| 四虎成人精品永久免费av九九| 欧美大片免费播放| 欧美色视频在线观看| 国内亚洲精品| 春日野结衣av| 中文字幕av一区二区| 肉色丝袜一区二区| www在线视频| 99久久久久国产精品免费| 亚洲一区二区视频| 美女午夜精品| 日本香蕉视频在线观看| 日韩欧美一区中文| 99成人免费视频| 中文字幕不卡免费视频| 国产精品成人在线| 亚洲一区在线电影| 欧美人与拘性视交免费看| 2018av男人天堂| 久久久久久久久久国产精品| 99国产精品视频免费观看| 成人51免费| 成人毛片高清视频观看| 欧美有码在线视频| 亚洲永久免费视频| 欧美精选一区二区三区| 视频在线91| 99中文视频在线| 亚洲а∨天堂久久精品喷水 | 欧美理论电影在线| 欧美三区视频| 波多野结衣中文字幕久久| 隔壁人妻偷人bd中字| 日日狠狠久久偷偷四色综合免费| 93久久精品日日躁夜夜躁欧美| 久久综合社区| 毛片在线看网站| eeuss中文| 国产99久久精品一区二区永久免费| 欧美性videos高清精品| 国产精一区二区三区| 欧洲在线一区| 悠悠资源网亚洲青| 色噜噜狠狠一区二区三区| 亚洲美女激情视频| 亚洲在线黄色| 免费在线观看av片| www黄色av| 欧美黑人狂野猛交老妇| 粉嫩在线一区二区三区视频| 日韩成人综合网| 国产女人在线观看| 在线日韩日本国产亚洲| 久久精品视频一区二区| 激情五月***国产精品| fc2ppv国产精品久久| 欧美高清视频一区| 操91在线视频| 日韩欧美综合在线视频| 蜜臀av一区二区三区| 美女福利一区二区| 看黄的a网站| yellow视频在线观看一区二区| 奇米777影视成人四色| 亚洲免费成人av电影| 裸体在线国模精品偷拍| 成全电影大全在线观看| 综合网五月天| 亚洲色图50p| 91欧美一区二区| 77成人影视| 高潮白浆视频| 成人免费高清完整版在线观看| 精品国产乱码久久久久久婷婷| 不卡中文字幕| 天堂а在线中文在线无限看推荐| 91成人免费观看| 日韩一级片网址| 国产91精品久久久久久久网曝门| 日本在线视频一区二区| 日韩中文字幕在线视频观看| 久久综合88中文色鬼| 最新热久久免费视频| 亚洲天堂一区二区三区四区| 天堂资源在线中文| 老司机av福利| 欧美激情一区二区三区高清视频| 亚洲在线免费播放| 在线电影一区| 免费观看亚洲| 香蕉视频色版| 视频一区在线免费观看| 麻豆乱码国产一区二区三区| 亚洲第一搞黄网站|