国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

擊敗整個羊駝家族,Meta AI自對齊新方法只需極少人工標注數據

人工智能 新聞
大語言模型需要大量人工標注的指令數據進行微調,而現在模型可自動從網絡語料庫未標記的文本中推理出指令。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

人工標注數據告急?

Mata新方法僅用少量種子數據,就構建了一個高質量的指令遵循( instruction following)語言模型。

換言之,大語言模型需要大量人工標注的指令數據進行微調,而現在模型可自動從網絡語料庫未標記的文本中推理出指令。

然后用自己生成的指令數據進行訓練,堪比自產自銷。

并且用這種方法訓練出的模型在Alpaca基準測試上,超越開源羊駝及其一系列衍生模型

LeCun發推認為該研究在模型自對齊方面具有轟動性:

用網友的一句話總結:

羊駝開始自我訓練了。

圖片

兩句話總結是這樣嬸兒的:

原本需要指令>響應數據集(需要人工標注),現在只需要簡單訓練一個“反向模型”做響應>指令。任何文本可隨意轉換為指令數據集。

還有網友發出靈魂拷問:

是只有我一個人,覺得這看起來像是通往超級智能的道路?如果你不需要額外的高質量外部數據,就能獲得越來越智能的LLM,那么這就是一個自我改進的封閉系統。

也許只需要一種強化學習系統來提供信號,然后LLM自身的迭代就可以完成其余的工作。

羊駝:我自己搞數據訓練了一頭鯨

這種可擴展的新方法叫做指令回譯,Mata為用這種方法訓練出的模型起了個名字——Humpback(座頭鯨,又稱駝背鯨)。

(研究人員表示,之所以起這么個名字,是因為它和駱駝背的關系,而且鯨魚體型更大,對應模型規模更大)

訓練一個Humpback的步驟簡單來說就是,從少量標注數據開始,使用語言模型生成未標注文本所對應的指令,形成候選訓練數據。再用模型評估數據質量,選擇高質量數據進行再訓練。然后重復該過程,進一步改進模型。

圖片

如上圖所示,需要準備的“材料”有:

  • 一個基礎模型——LLaMa
  • 一個由Open Assistant數據集中的3200個示例構成的種子數據(Seed Data),每個示例包括一個指令和對應的輸出。
  • 從ClueWeb語料中抽取了502K段已去重、過濾、刪除了潛在低質量段落的未標注文本(Unlabeled Data)。

標注示例和語料來源都有了,下一步就是自增強(Self-augment)階段。

研究人員用種子數據對基礎模型LLaMa進行了微調,獲得指令預測模型。然后用這個指令預測模型,為未標注文本推理出一個候選指令。之后組合候選指令與文本(指令-輸出對),作為候選增強訓練數據,也就是上圖中的Augmented Data A。

但還不能用A的數據直接訓練,因為未標注文本本身質量參差不齊,生成的候選指令也存在噪聲。

所以需要關鍵的自管理(Self-curate)步驟,使用模型預測數據質量,選擇高質量樣本進行訓練。

圖片

具體來說,研究人員使用僅在種子數據上微調的指令模型對候選數據打分。滿分五分,分數較高的才會被挑選出來作為下一輪的候選數據。

為了提高模型指令預測質量,研究人員用候選數據迭代訓練了模型,在迭代訓練中,數據質量也會越來越好。

此外,在組合種子數據和增強數據微調模型時,他們還使用不同的系統提示標記區分了這兩個數據源:

  • 種子數據使用提示“Answer in the style of an AI Assistant.”
  • 篩選數據使用提示“Answer with knowledge from web search.”

進行兩輪迭代后,最終模型就新鮮出爐啦。

合并兩種訓練數據:1+1>2

下面再來看看研究人員的分析結果:

圖片

△種子數據和增強數據的指令多樣性。內圈是常見的根動詞,外圈是與其對應的常見名詞。

上圖是用8%種子數據和13%的增強數據統計的指令多樣性。

可以很直觀地看到,在長尾部分增強數據多樣性更強,且增強數據與現有的人工標注種子數據相輔相成,補充了種子數據中未出現的類型。

其次,研究人員比較了三個增強數據集:Augmented data,all(無自管理)、圖片數據更少但質量更高的圖片

實驗觀察到,盡管數據集變小,但伴隨著訓練數據質量的提升模型性能也有了很好的提升。

圖片

△使用自篩選評估不同數據大小和質量的自增強數據。y軸表示在使用給定數據大小和質量微調LLaMa 7B時與text-davinci-003的勝率。

(text-davinci-003,一種基于GPT-3的指令遵循模型,使用強化學習在人類編寫的指令數據、輸出、模型響應和人類偏好上進行了微調)

最后來看一下Alpaca排行榜上的結果。Humpback在不依賴蒸餾數據的情況下,表現明顯優于其它方法,并且縮小了與專有模型之間的差距。

非蒸餾(Non-distilled),指不依賴于任何外部模型作為任何形式監督的訓練模型;蒸餾(Distilled),指在訓練過程中引入更強大的外部模型,例如使用從外部模型蒸餾的數據;專有(Proprietary),指使用專有數據和技術進行訓練的模型。

圖片

△相對于text-davinci-003的勝率

在與開源模型LIMA 65B、Guanaco 65B、Falcon-Instruct 40B和專有模型davinci-003、Claude的比較中,Humpback的表現也都更符合人類偏好。

圖片

此外,研究人員還指出了該方法的局限性:

由于用于訓練的文本數據來自網絡語料庫,微調后的模型可能會放大網絡數據的偏差。雖然和基礎模型相比,微調后的模型提高了檢測偏差的準確性。然而,這并不意味著會完全解決這個問題。

傳送門:https://arxiv.org/abs/2308.06259(論文鏈接)

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-08-15 14:05:27

AI模型

2015-08-21 09:14:40

大數據

2014-02-26 10:53:10

2024-10-23 19:47:54

2023-03-24 08:16:50

3D模型分割人工標注

2023-04-25 17:13:03

模型AI

2021-09-27 10:12:42

欺騙防御rMTD網絡攻擊

2023-07-06 15:29:52

數據中心能源回收

2010-04-01 09:30:57

2023-05-22 09:28:30

模型AI

2018-10-07 07:00:59

2019-07-12 13:50:36

物聯網大數據安全

2022-07-07 10:47:16

IngressKubernetes

2023-05-05 18:45:21

Python人工智能機器學習

2023-07-25 14:08:41

羊駝模型

2022-12-08 13:00:10

AI性別偏見

2023-09-25 10:04:37

模型AI

2025-02-06 07:26:35

2011-03-14 10:10:01

2011-12-01 14:15:19

信息優化惠普
點贊
收藏

51CTO技術棧公眾號

户外极限露出调教在线视频| 色成人亚洲网| 日韩系列在线| 久久久91精品国产一区不卡| 中文字幕网在线| 亚洲婷婷综合色高清在线| 日本不卡免费新一二三区| 欧美高清在线| 日本高清视频精品| 动漫3d精品一区二区三区乱码| 精品小视频在线| 自拍视频在线| 欧美三级中文字幕在线观看| 青春有你2免费观看完整版在线播放高清 | 三上悠亚在线一区二区| 波多野结衣一区二区三区| 一区二区不卡在线| 日韩国产精品91| 亚洲欧美一区二区原创| 美女一区二区久久| 成人短视频在线观看免费| 国产一二精品视频| 青青青免费在线| 国产日韩精品一区二区浪潮av | 美女福利精品视频| 精品视频一二| 久久久综合av| 日韩人体视频| 成人免费淫片aa视频免费| 亚洲国产一区二区在线观看| 国产原创精品| 日本大胆欧美人术艺术动态| 亚洲欧洲精品一区二区| 麻豆精品国产传媒mv男同| 水蜜桃在线免费观看| 成人涩涩免费视频| 999精彩视频| 精品国产999| 国产在线1区| 亚洲欧美一区二区精品久久久| 黄色成人小视频| 热草久综合在线| 亚洲国产免费看| 男女私大尺度视频| 亚洲精品亚洲人成人网在线播放| 岛国大片在线观看| 亚洲精品成人av| 国产精品一线| 狠狠色综合欧美激情| 国产精品一区二区久激情瑜伽| 色视频网站在线| 欧美精品三级日韩久久| 99亚洲伊人久久精品影院| 国产97在线亚洲| 久久久久国产精品午夜一区| 可以免费在线看黄的网站| 五月综合激情网| 欧美色999| 成人国产精品久久久| 久久99国产精品尤物| www.亚洲高清| 在线观看91av| 日韩高清电影免费| 四虎永久国产精品| 亚洲欧洲国产日本综合| 欧美三级黄网| 欧美日韩国产成人在线观看| 在线观看国产精品入口| 国产精品无码免费专区午夜| 精品国产乱码久久久久久虫虫漫画 | 成人精品一区二区三区免费 | 欧美中文字幕在线视频| 亚洲激情在线| 日韩精品免费播放| 欧美日本一区二区在线观看| 亚洲啊v在线免费视频| 国模精品娜娜一二三区| 欧美国产一区视频在线观看| 日本高清成人vr专区| 国产97色在线| 大陆成人av片| 美女黄视频在线观看| 欧美一区二三区| 国产精品2024| 国产在线69| 成人www视频在线观看| 丰满放荡岳乱妇91ww| 在线视频自拍| 国产精品激情av电影在线观看| 懂色av一区二区三区蜜臀| 国产一二三在线观看| 欧美精品激情在线| 紧缚奴在线一区二区三区| 欧美日韩在线中文字幕| 久久久久久久久久久91| 国产乱子伦视频一区二区三区| 久久av少妇| 国产精品扒开腿做爽爽爽男男| 成人h精品动漫一区二区三区| 蜜桃视频网站在线观看| 国产精品96久久久久久| 久久综合九色综合97_久久久| 欧美韩日亚洲| 国产伦精品一区二区| 一区二区免费在线播放| 亚洲精品黑牛一区二区三区| 无码毛片aaa在线| 日韩欧美一区二区免费| 亚洲精品va| 最近97中文超碰在线| 68精品国产免费久久久久久婷婷| 99久久精品国产一区| 久久精品女人天堂av免费观看 | 国产日韩专区| 欧美日本韩国一区二区| 日本91av在线播放| 久久女同性恋中文字幕| 欧美日韩亚洲国产| 亚洲一卡二卡区| 欧美一区二区三区爱爱| 亚洲高清av| 两个人hd高清在线观看| 国产91免费观看| 亚洲天堂福利av| 亚洲国产网址| 日本激情视频在线播放| 久久精品91久久香蕉加勒比 | 奇米888一区二区三区| 欧美视频精品在线观看| 欧美激情777| 最新天堂资源在线资源| 国产精品91在线观看| 亚洲人成网站色在线观看| 欧美一区 二区| 毛片视频免费观看| 国产精品久久久久久久久借妻 | 91精品电影| 色在线免费视频| 亚洲一区二区三区四区在线播放| 狠狠色噜噜狠狠狠狠97| 欧美 日韩 国产一区二区在线视频 | 日韩福利视频导航| 久久香蕉av| 国产美女视频免费| 国产一区二区日韩精品欧美精品| 国内精品国产三级国产a久久| 成人性生交大片免费网站| 免费cad大片在线观看| 最新的欧美黄色| 国产精品久久久99| 精品欧美久久| 成人不用播放器| 蜜桃av噜噜一区二区三区| 亚洲成色777777女色窝| 99久久精品免费精品国产| 免费观看亚洲天堂| 九色视频网站入口| 国产66精品久久久久999小说| 日韩欧美高清dvd碟片| 成人免费视频caoporn| 少妇一区二区三区| h网站视频在线观看| 手机成人av在线| 久久露脸国产精品| 色婷婷综合久久久中文字幕| 青青草精品视频| 亚洲精品aⅴ| 国产高清在线看| 欧美日韩中文字幕在线播放| 亚州欧美日韩中文视频| 在线观看亚洲精品| 国产91综合网| 久久看人人摘| 91精品论坛| 全部孕妇毛片丰满孕妇孕| 精品国产一区二区三区麻豆小说 | 国产日韩欧美视频| 欧美一区欧美二区| 91在线国内视频| 久久久久久久久丰满| 三级中文字幕在线观看| 五月婷婷导航| 欧美日韩精品中文字幕一区二区| www.99久久热国产日韩欧美.com| 亚洲午夜激情网页| 美女久久久精品| 人人香蕉久久| 春色校园综合激情亚洲| v888av成人| 97超碰免费观看| 成人信息集中地欧美| 国产亚洲精品久久久久久牛牛| 亚洲成a人v欧美综合天堂| 国产在线精品一区二区夜色| 激情婷婷综合| 精品三区视频| www视频在线观看免费| 日日噜噜夜夜狠狠| 宅男av一区二区三区| 91偷拍精品一区二区三区|