国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權重全開源

人工智能 新聞
全新代碼大模型Magicoder,不到7B參數(shù),就能在代碼生成領域與頂級代碼模型不相上下。

開源「代碼大模型」來了!

UIUC清華團隊的研究人員發(fā)布了Magicoder,不到7B參數(shù),就能在代碼生成領域與頂級代碼模型不相上下。

值得一提的是,Magicoder的代碼、權重和數(shù)據(jù),毫無保留完全開源。

論文地址:https://arxiv.org/abs/2312.02120

Magicoder依靠的OSS-INSTRUCT的方法,是通過對現(xiàn)有頂級代碼模型(例如ChatGPT)的提示,加上網(wǎng)絡上的種子代碼片段,來生成的代碼。

這可真是取之于大模型,用之于大模型;就有網(wǎng)友轉發(fā)說道:通過這些結果,看到了提高用于LLMs的合成數(shù)據(jù)的潛力也是一個非常有趣的領域。

話不多說,那就讓我們來具體了解一下Magicoder的來歷吧!

代碼生成的發(fā)展史

代碼生成(Code Generation),也叫程序合成(Program Synthesis),近幾十年來,一直都是學術界的一塊「硬骨頭」,在此領域進行過的許多嘗試,例如基于抽象的合成和基于示例的編程,都沒有取得很好的效果。

直到最近,使用在代碼上訓練的大型語言模型取得了顯著的突破,被廣泛應用于輔助實際軟件開發(fā)。

最初,諸如GPT-3.5 Turbo和GPT-4之類的閉源模型主導了各種代碼生成基準和排行榜。

為了推動開源LLM在代碼生成領域的應用,SELF-INSTRUCT方法被開發(fā)出來,通過使用強大的LLM生成合成的編碼指令,并利用這些指令對較弱的學生模型進行微調,以從強大的教師模型中提取知識。

然而,SELF-INSTRUCT在提高LLM的指令遵循能力時,仍然依賴于狹窄范圍的預定義任務或啟發(fā)式方法。

為了解決這一問題,UIUC和清華的研究人員提出了Magicoder,其中采用的OSS-INSTRUCT方法,旨在減輕LLM固有的偏見,通過直接學習開源代碼釋放其創(chuàng)造高質量和創(chuàng)意編碼指令的潛力。

OSS-INSTRUCT通過從開源中搜集的隨機代碼片段獲得靈感,自動生成新的編碼問題。借助于不同的種子代碼片段,OSS-INSTRUCT能夠直接產(chǎn)生多樣、真實和可控的編碼指令數(shù)據(jù)。

如下圖所示,在這個例子中,LLM從兩個不同函數(shù)的不完整代碼片段中獲取靈感,成功地將它們關聯(lián)起來,并構建出一個現(xiàn)實的機器學習問題。

由于OSS-INSTRUCT與現(xiàn)有的數(shù)據(jù)生成方法是正交的,OSS-INSTRUCT可以被同時結合使用,進一步推動模型在編碼任務中的能力。

為什么OSS-INSTRUCT如此神奇?

OSS-INSTRUCT的工作方式是通過對LLM(例如ChatGPT)進行提示,然后根據(jù)從互聯(lián)網(wǎng)搜集的一些種子代碼片段(例如來自GitHub)生成編程問題及其解決方案。

一方面,種子片段提供了生成的可控性;

另一方面,OSS-INSTRUCT加強了LLM創(chuàng)建編程問題的多樣化,更符合真實的編程場景。

我們可以從以下幾個指標中一探究竟:

1. 類別平衡

如下圖所示,通過計算OSS-INSTRUCT中每個樣本的嵌入與這10個類別之間的余弦相似性,可以看出其在不同類別之間表現(xiàn)出了多樣性和平衡。

2. 長度分布

下圖展示生成問題和解決方案的長度分布,良好的平衡性讓OSS-INSTRUCT更貼合實際應用場景。

3. 與HumanEval的相似性計算

下圖展示了與HumanEval樣本的余弦相似性。

可以看出,OSS--INSTRUCT在所有研究的數(shù)據(jù)生成技術中表現(xiàn)出最低的平均相似度,這說明OSS--INSTRUCT生成的數(shù)據(jù)是最富有多樣性的。

但是,既然OSS-INSTRUCT獲取到的種子片段來自于開源代碼,為什么不直接在這些開源代碼上進行微調呢?

為了回答這個問題,研究人員遵循CodeSearchNet,使用基礎的CODELLAMA-PYTHON-7B對配對數(shù)據(jù)進行了2個時期的微調,遵循相同訓練設置。

對比結果如下表,在75,000個配對注釋-函數(shù)數(shù)據(jù)上,微調甚至使基礎模型惡化,而OSS-INSTRUCT有助于引入實質性的提升。

研究人員推測,這種惡化可能是由這些配對數(shù)據(jù)固有的大量噪聲和不一致性導致的。

這進一步表明,數(shù)據(jù)的真實性對于代碼指令調整至關重要,而非格式。

該結果還凸顯了OSS-INSTRUCT的優(yōu)越性,可以將這些松散相關的代碼片段轉化為語義一致的指令調整數(shù)據(jù)。

Magicoder表現(xiàn)評估

研究團隊首先構建了使用OSS-INSTRUCT進行訓練的Magicoder系列,同時進一步組合使用OSS-INSTRUCT和Evol--INSTRUCT構建了MagicoderS系列,并在兩個系列上都進行了測試。

代碼生成基準使用的是HumanEval和MBPP,這是目前兩個最廣泛使用的基準。這些基準中的每個任務都包括一個任務描述(例如docstring)作為提示,然后讓LLMs生成相應的代碼。其正確性由少量測試用例進行檢查。

為了更嚴格的評估,研究人員還使用了由EvalPlus框架支持的HumanEval+和MBPP+以獲取更多的測試。

值得注意的是,MagicoderS-CL和MagicoderS-DS在HumanEval+上的表現(xiàn)都優(yōu)于只有7B參數(shù)的ChatGPT。

讓我們具體看下Magicoder的表現(xiàn):

1. Python語言

我們首先可以觀察到Magicoder-CL相在HumanEval和HumanEval+上相對于CODELLAMA-PYTHON-34B有了實質性的改進。

MagicoderS-CL在HumanEval+上優(yōu)于ChatGPT和所有其他開源模型。

此外,盡管在HumanEval上得分略低于WizardCoder-CL-34B和ChatGPT,但在更嚴格的HumanEval+數(shù)據(jù)集上超過了它們,這表明MagicoderS-CL可能生成更穩(wěn)健的代碼。

2. 其他編程語言

在除了Python之外的語言對比中,Magicoder-CL在所有研究過的編程語言中都大幅超過了基礎的CODELLAMA-PYTHON-7B。

此外,MagicoderS-CL在所有編程語言上都進一步改進了Magicoder-CL,僅使用7B參數(shù)就實現(xiàn)了與WizardCoder-CL-34B相當?shù)男阅堋?/span>

值得注意的是,Magicoder-CL僅使用非常有限的多語言數(shù)據(jù)進行訓練,但仍然優(yōu)于其他具有相似甚至更大規(guī)模的LLMs。這意味著LLMs可以從數(shù)據(jù)中學習超出其格式的知識。

3. 數(shù)據(jù)科學庫

最后,針對7個熱門Python數(shù)據(jù)科學庫的1,000個獨特的數(shù)據(jù)科學編碼問題(DS-1000 dataset),研究人員也進行了單元測試,旨在評估LLMs在實際用例中的表現(xiàn)。

從表中可以看出,Magicoder-CL-7B已經(jīng)在所有評估的基線中表現(xiàn)出色,包括最先進的WizardCoder-SC-15B,改善了8.3個百分點。

雖然Magicoder還不夠完美,但作者認為,通過公開分享所有的數(shù)據(jù)和代碼細節(jié),會有越來越多的先進代碼模型出現(xiàn)。

讓我們也拭目以待。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-07-22 09:00:00

2024-03-18 07:01:42

2025-03-20 08:34:14

2024-07-22 07:10:00

小模型機器學習蘋果

2025-02-10 14:30:00

模型數(shù)據(jù)開源

2024-12-03 15:51:45

2025-04-14 09:27:00

2025-12-03 17:21:36

Ovis7B 參數(shù)MLLM

2024-06-03 10:43:34

2024-02-22 10:09:00

開源模型

2025-04-02 09:00:00

模型開源AI

2025-06-23 09:01:00

2025-01-06 07:40:00

2024-05-15 09:17:30

模型AI

2025-10-15 14:10:47

AI模型開源

2023-12-14 13:00:00

AI訓練

2023-12-17 13:07:11

訓練數(shù)據(jù)

2025-03-27 09:40:59

2023-10-13 19:58:33

Mistral7B模型

2024-02-04 07:20:00

AI模型
點贊
收藏

51CTO技術棧公眾號

欧美在线www| 日本一区二区免费高清视频| 国产日产一区二区| 激情五月播播久久久精品| 欧美激情视频在线免费观看 欧美视频免费一 | 日韩精品中午字幕| 国产a级片免费观看| 国产情侣一区| 欧美做爰性生交视频| 秋霞伦理一区| 日本高清无吗v一区| 精品久久久久久久无码 | 欧美精品一卡| 97精品国产91久久久久久| 精精国产xxxx视频在线野外| 黑人巨大精品欧美一区免费视频 | 成人免费在线一区二区三区| 9999精品| 亚洲欧美日韩一区二区在线| 啊v视频在线| 一区二区欧美精品| 欧美日韩第二页| 国产尤物一区二区| 日本一区二区三区四区高清视频| 国产亚洲福利社区| 久久资源在线| 国产精品一二三区视频| 伊人影院久久| 91色视频在线观看| 国产精品片aa在线观看| 国产最新精品视频| 51精品国产| 欧美黑人狂野猛交老妇| 日韩精品第一| 国产一区二区三区直播精品电影| 丝袜国产在线| 女海盗2成人h版中文字幕| 国产亚洲高清视频| 国产一区二区三区av在线| 国产精品国内免费一区二区三区| 青青久久av北条麻妃海外网| 国产精品视频久久| 在线精品视频在线观看高清| 青青在线视频一区二区三区| 一区二区三区高清视频在线观看| 7m精品福利视频导航| 麻豆一区在线| 欧美老少做受xxxx高潮| 综合久久伊人| 欧美国产极速在线| 高清精品视频| 国色天香2019中文字幕在线观看| 亚洲大奶少妇| 91精品国产高清久久久久久91| 91麻豆精品激情在线观看最新| 欧美片一区二区三区| 欧美区一区二区| 4438全国亚洲精品在线观看视频| 国产激情综合| 51精品在线观看| 精品免费一区二区| 99re视频在线| 日产国产欧美视频一区精品| 亚洲精品中文综合第一页| 激情文学综合丁香| av7777777| 1000部国产精品成人观看| 免费亚色电影在线观看| 亚洲成人av资源| 久久bbxx| 国产午夜精品美女视频明星a级| 国产精品麻豆| 国产一区二区香蕉| 蜜桃视频一区二区三区| 日韩欧美一区二| 中文字幕一区二区三区不卡| 在线观看你懂| 欧美精品一区二区三区蜜桃| 韩国美女久久| 91大神福利视频在线| 亚洲精品男同| 欧美视频在线免费播放| 亚洲色图第一区| 国内在线精品| 亚洲男人的天堂网站| 91精品一久久香蕉国产线看观看| 欧洲成人免费aa| 亚洲国产一区二区三区a毛片| 三年中文高清在线观看第6集| 26uuu精品一区二区在线观看| 天天影视色香欲综合| 91麻豆精品91久久久久同性| 久久亚洲人体| 91综合免费在线| 国产剧情在线观看一区二区| 污污网站免费观看| 91精品久久久久久久久99蜜臂| 国产精品伊人| 亚洲一区免费网站| 国产黄色91视频| 中文在线√天堂| 亚洲三级av在线| 天天综合网91| 日本www在线视频| 欧美性大战xxxxx久久久| 日韩免费大片| 久久国产精品久久精品国产| 久久久三级国产网站| 美女毛片在线看| 久久久999精品视频| 影音先锋在线一区| 欧美激情国产精品日韩| 欧美男女性生活在线直播观看| 欧美视频二区欧美影视| 久久99精品久久久久久青青日本| 久久久久久久性| 成人超碰在线| 91情侣在线视频| 国产午夜三级一区二区三| 91香蕉在线观看| 国产成人综合精品在线| 成人性生交大片免费看视频在线| 国产主播福利在线| 久久久噜久噜久久综合| 久久99国产精品免费| 高清毛片在线看| 国产成人在线播放| 久久久噜噜噜久噜久久综合| 超碰在线中文字幕| 国产一区二区视频在线免费观看| 亚洲欧洲三级电影| 国产精品亚洲欧美一级在线 | 成人性生活视频| 韩国成人动漫在线观看| 亚洲免费毛片网站| 国产亚洲高清一区| 国产一区二区三区在线免费| 欧美久久久久免费| 一区二区电影在线观看| 97影院理论片在线播放| 久久综合国产精品台湾中文娱乐网| 美女国产一区二区三区| 一级日本在线| 91在线看网站| 日韩欧美成人网| 日韩欧美伦理| **毛片在线网站| 国产成人拍精品视频午夜网站| 日本一区二区三级电影在线观看| 99欧美精品| 青草青青在线视频| 一区二区三区www| 国产不卡免费视频| 69av成人| 正在播放91九色| 亚洲精品v欧美精品v日韩精品| 亚洲免费综合| 久久香蕉av| 永久免费看av| 中文字幕一区电影| 99视频有精品| 日韩精品视频中文字幕| 乱妇乱女熟妇熟女网站| 日韩最新在线视频| 久久九九影视网| 久久动漫网址| 成年免费网站| 91精品在线影院| 欧美午夜影院一区| 久久一二三四| 黑人巨大亚洲一区二区久| 欧美国产日韩激情| 久久精品国产视频| 国产精品电影一区二区| 九色精品国产蝌蚪| 欧美孕妇孕交| 欧美一卡2卡3卡4卡无卡免费观看水多多 | 久久精品亚洲欧美日韩精品中文字幕| 日本一二三区视频免费高清| 国产精品久久久久久久app| 亚洲精品老司机| 亚欧美无遮挡hd高清在线视频| 91在线看黄| 先锋影音网一区| 神马国产精品影院av| 国产精品第五页| 欧美福利一区| 天堂av在线电影| 岳毛多又紧做起爽| 国产精品久久久久久网站| 91黄色免费观看| 久久国产精品无码网站| 九九九九九九精品任你躁| 丝袜制服影音先锋| 国产一区精品视频| 有码中文亚洲精品| 又紧又大又爽精品一区二区| 欧美日韩网站| 国产精品亚洲d| 人人超碰在线|