国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Open LLM榜單再次刷新,比Llama 2更強的「鴨嘴獸」來了

人工智能 新聞
作為 LLaMa-2 的微調擴展,Platypus 保留了基礎模型的許多限制條件,并因其有針對性的訓練而引入了特定的挑戰。它共享 LLaMa-2 的靜態知識庫,而知識庫可能會過時。

為了挑戰 OpenAI 的 GPT-3.5 和 GPT-4 等閉源模型的主導地位, 一系列開源模型力量正在崛起,包括 LLaMa、Falcon 等。最近,Meta AI 發布了 LLaMa-2 模型,被譽為開源領域最強的大模型,很多研究者也在此基礎上搭建自己的模型。比如,StabilityAI 利用 Orca 風格的數據集對 Llama2 70B 模型進行了微調,打造出了 StableBeluga2,在 Huggingface 的 Open LLM 排行榜中也取得了不錯的成績。

最近,Open LLM 榜單的排行又發生了新的變化,一個名叫 Platypus(鴨嘴獸)的模型登上了榜首。

圖片

概括地說,Platypus 同樣是基于 Llama 2 微調。來自波士頓大學的作者使用了 PEFT 和 LoRA 以及數據集 Open-Platypus 進行優化。

圖片

在一篇論文中,作者對 Platypus 進行了詳細的介紹:

圖片

論文地址:https://arxiv.org/abs/2308.07317

本文的貢獻主要有以下幾點:

  • Open-Platypus 是一個小規模的數據集,由公共文本數據集的精選子集組成。該數據集由 11 個開源數據集組成,重點是提高 LLM 的 STEM 和邏輯知識。它主要由人類設計的問題組成,只有 10% 的問題是由 LLM 生成的。Open-Platypus 的主要優勢在于其規模和質量,它可以在很短的時間內實現非常高的性能,并且微調的時間和成本都很低。具體來說,在單個 A100 GPU 上使用 25k 個問題訓練 13B 模型只需 5 個小時。
  • 描述了相似性排除過程,減少數據集的大小,并減少數據冗余。
  • 詳細分析了始終存在的開放 LLM 訓練集與重要 LLM 測試集中包含的數據相污染的現象,并介紹了作者避免這一隱患的訓練數據過濾過程。
  • 介紹了對專門的微調 LoRA 模塊進行選擇和合并的過程。

Open-Platypus 數據集

目前,作者在 Hugging Face 上發布了 Open-Platypus 數據集:


圖片

污染問題

本文方法優先考慮防止基準測試問題泄漏到訓練集中,以避免僅通過記憶產生結果偏差。作者努力追求準確性的同時,也認識到標記重復問題時需要靈活性,因為問題的提出方式多種多樣,而且會受到通用領域知識的影響。為了管理潛在的泄漏,作者精心設計了啟發式方法,用于手動過濾 Open-Platypus 中與基準問題余弦嵌入相似度超過 80% 的問題。他們將潛在泄漏分為三類:(1) 重復;(2) 灰色區域;(3) 相似但不相同。并且,為謹慎起見,他們將所有組別都排除在訓練集之外。

重復

這幾乎完全復制了測試題集的內容,可能只是稍稍改動了一下單詞或稍作重新排列。根據上表中泄漏問題的數量,這是作者認為真正屬于污染的唯一類別。具體例子如下:

灰色區域

以下問題被稱為灰色區域,包括并非完全重復、屬于常識范疇的問題。雖然作者將這些問題的最終評判權留給了開源社區,但他們認為這些問題往往需要專家知識。需要注意的是,這類問題包括指令完全相同,但答案卻同義的問題:

相似但不相同

這些問題的具有較高的相似度,但由于問題之間有著細微的變化,在答案上存在著顯著差異。

微調與合并

在完善數據集之后,作者將重點放在兩種方法上:低秩近似(LoRA)訓練和參數高效微調(PEFT)庫。與完全的微調不同,LoRA 保留了預訓練的模型權重,并在 transformer 層中整合了秩分解矩陣。這就減少了可訓練參數,節省了訓練時間和成本。起初,微調主要針對注意力模塊,如 v_proj、q_proj、k_proj 和 o_proj。后來,根據 He et al. 的見解,過渡到 gate_proj、down_proj 和 up_proj 模塊。除了可訓練參數小于總參數的 0.1% 時,這些模塊均顯示出了更好的效果。作者對 13B 和 70B 模型統一采用了這一方法,結果可訓練參數分別為 0.27% 和 0.2%。唯一的差異在于這些模型的初始學習率。

結果

作者將 Platypus 與其他的 SOTA 模型進行了比較。根據 2023 年 8 月 10 日的 Hugging Face Open LLM 排行榜數據,Platypus2-70Binstruct 變體表現優于其他競爭對手,以 73.13 的平均分穩居榜首:

值得注意的是,Stable-Platypus2-13B 模型以 63.96 的平均分成為 130 億參數模型中的佼佼者:

圖片

局限性

作為 LLaMa-2 的微調擴展,Platypus 保留了基礎模型的許多限制條件,并因其有針對性的訓練而引入了特定的挑戰。它共享 LLaMa-2 的靜態知識庫,而知識庫可能會過時。此外,還存在生成不準確或不恰當內容的風險,尤其是在提示不明確的情況下。雖然 Platypus 在 STEM 和英語邏輯方面得到了增強,但它對其他語言的熟練程度并不可靠,而且可能不一致。它偶爾也會產生帶有偏見或有害的內容。作者表示已經努力減少這些問題,但挑戰依然存在,尤其是在非英語語言方面。

Platypus 可能會被濫用于惡意活動,這也是一個令人擔憂的問題。開發人員應在部署前對其應用程序進行安全測試。Platypus 在其主要領域之外可能存在局限性,因此用戶應謹慎行事,并考慮進行額外的微調以獲得最佳性能。用戶應確保 Platypus 的訓練數據與其他基準測試集之間沒有重疊。作者對數據污染問題非常謹慎,避免與在有污點的數據集上訓練的模型合并。雖然經過清理的訓練數據中確認沒有污染,但也不排除有些問題漏掉了。如需全面了解這些限制,請參閱論文中的限制部分。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-08-21 10:20:03

開源模型

2017-03-23 13:07:00

小程序DCloud

2023-08-01 13:31:18

模型Alpacaicuna

2022-01-07 09:56:49

自然語言神經網絡人工智能

2021-07-21 08:59:10

requestsPython協程

2023-11-17 22:55:09

量化模型

2024-10-18 16:10:00

AI文生圖框架

2023-09-12 13:29:46

AI訓練

2018-05-29 10:57:14

知道創宇

2023-07-19 09:00:00

模型AI

2023-09-04 19:09:00

訓練模型數據

2018-08-20 14:38:58

手機

2021-06-17 13:59:00

芯片半導體

2025-10-23 08:25:08

2025-03-27 10:12:49

2019-09-18 14:46:52

mancheatLinux

2012-11-09 10:16:22

ARM低功耗Intel

2023-07-10 13:46:58

PythonLlama.cppLLM

2024-03-28 12:53:00

AI數據
點贊
收藏

51CTO技術棧公眾號

日本美女一区二区三区视频| 91成人看片片| 无限国产资源| 91精品久久久久久蜜臀| 日韩三级影视| 91青草视频久久| 黑人精品欧美一区二区蜜桃| 先锋成人影音| 丝袜亚洲另类欧美重口| 欧美大片aaaa| 成年人午夜视频在线观看| 欧美三区在线观看| 日韩成人av在线资源| 日韩精品一区二区三区色偷偷| 久久综合中文字幕| 久久99亚洲网美利坚合众国| 国产日韩欧美自拍| 99精品视频在线观看| 不卡的av影片| 92福利视频午夜1000合集在线观看| 国产二区国产一区在线观看| 国内精品久久久久国产| 91午夜在线播放| 亚洲成人精品一区| 国产一卡不卡| 中文字幕国产在线| 欧美中文字幕视频在线观看| 99热99精品| 97精品久久| 激情四房婷婷| 国产精品成人免费电影| 亚洲综合清纯丝袜自拍| 激情综合网站| 91电影在线播放| 成人av动漫在线| 国产成人艳妇aa视频在线| 亚洲美女喷白浆| 久久男人中文字幕资源站| 伊人久久大香| 97影院在线观看| 国产精华一区| 日韩成人xxxx| 成人一区在线看| 国产亚洲电影| 黄色片在线免费观看| 亚洲欧洲精品一区二区| 日韩一区二区三区三四区视频在线观看 | 日本特级黄色大片| 一区二区三区无码高清视频| 91视频在线观看免费| 三级小说欧洲区亚洲区| 男人的天堂在线视频| 正在播放国产精品| 国产成人精品久久| 日韩欧美一区二区在线视频| 国产日韩欧美不卡| 日韩高清欧美| 高清一级毛片视频| 91麻豆精品国产自产在线| 自拍偷拍精选| 国产精品国产三级国产普通话99| 日韩三级电影免费观看| 欧美色123| 韩国成人av| 玖玖视频精品| 麻豆免费网站| 这里只有精品久久| 午夜天堂精品久久久久| 国产91色在线免费| 99在线精品免费| 国产第一亚洲| 欧美高清性xxxxhdvideosex| 日本不卡的三区四区五区| 在线成人福利| 91精品天堂| 日本高清不卡aⅴ免费网站| 忘忧草精品久久久久久久高清| 日韩人妻精品一区二区三区| 欧美高清视频一二三区 | av中文字幕在线观看第一页| 日韩一区二区在线观看| 精品伊人久久| 欧美成人高潮一二区在线看| 欧美激情亚洲另类| 中文在线а√天堂| 欧美在线观看网址综合| 欧美三级乱人伦电影| 日韩av二区在线播放| 欧美日韩一区二区三区四区不卡| 日韩精品黄色| 天天射综合网站| 久久精品二区| 92看片淫黄大片看国产片| 日韩中文字在线| 亚洲欧美国产毛片在线| 日日夜夜精品视频免费| 婷婷综合久久| 超碰中文在线| 久久久亚洲国产精品| 精品欧美一区二区三区久久久| 国产视频综合在线| 亚洲国产精品久久久男人的天堂| 91麻豆精品国产91久久久资源速度 | 日韩国产精品一区| 国产精品免费人成网站| 日韩av一级片| 国产一区欧美| 国产社区精品视频| 97超碰人人在线| jizzzz日本| 亚洲成人动漫精品| 精品久久影院| sese综合| 91桃色在线| av毛片在线免费| av今日在线| 中文在线视频| 最新中文字幕av专区| 成人免费视频久久| 黄色网址在线免费看| 奇米精品一区二区三区| 国产素人在线观看| 九色自拍视频在线观看| 狠狠97人人婷婷五月| 亚洲一区二区三区乱码aⅴ蜜桃女 亚洲一区二区三区乱码aⅴ | 欧美午夜久久久| 精品久久中文字幕| 欧美一级淫片007| 日韩精品福利网站| 中文字幕无线精品亚洲乱码一区| 亚洲国产综合色| 91久久香蕉国产日韩欧美9色| 亚洲欧美一区二区久久| 欧美性生交大片免网| 欧美精品三级在线观看| 884aa四虎影成人精品一区| 日本福利一区二区| 在线视频国产日韩| 中文在线一区| 精品人人人人| 欧美高清免费| 视频成人永久免费视频| 国产欧美日韩精品一区二区三区 | 色8久久人人97超碰香蕉987| 欧美一级生活片| 欧美群妇大交群中文字幕| 日韩视频不卡中文| 日韩视频永久免费观看| 成人欧美视频在线| 日产中文字幕在线精品一区| 日韩国产欧美亚洲| 欧美色视频免费| 亚洲小说春色综合另类电影| 国产精品巨作av| 毛片基地黄久久久久久天堂| 亚洲成a人片在线观看中文| 91精品免费观看| 在线视频欧美精品| 欧美乱大交xxxxx| 激情五月综合色婷婷一区二区 | 最新精品在线| 精品亚洲成a人在线观看| 激情av一区二区| 欧美专区第一页| 轻点好疼好大好爽视频| 男人的天堂日韩| 高清一级毛片视频| 亚洲综合专区| 精品久久久一区| 国产精品中文久久久久久久| 91成人在线看| 成人区精品一区二区| 97人人模人人爽人人少妇| 2019亚洲日韩新视频| 午夜激情一区| 日本高清中文字幕| 另类av导航| 在线天堂资源| 欧美亚洲大陆| 中文字幕精品一区二区精品绿巨人| 欧美大片va欧美在线播放| 欧美黑人狂野猛交老妇| 欧美xxxx18性欧美| 女同一区二区| 日韩精品一区二区三区四区五区| ts人妖另类在线| 男人天堂新网址| av片中文字幕| 日韩aaa久久蜜桃av| 国产成人精品影视| 一区二区三区91| 中文日韩在线视频| 91沈先生作品| 缅甸午夜性猛交xxxx| 日本一二三区在线视频| 99精品美女视频在线观看热舞| 成人av网站在线| 亚洲国产精品黑人久久久| 97视频精品| 亚洲乱码一区二区三区三上悠亚 |