国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

波士頓大學「鴨嘴獸-70B」登頂Hugging Face大模型排行榜!高效數據集+獨特LoRA微調是關鍵

人工智能 新聞
鴨嘴獸 70B登上Hugging Face上的開源大模型榜一,變強的原因是采用優化過的數據集訓練以及更高效的PEFT和獨特的LoRA微調。

Hugging Face上的開源大模型排名榜又更新了,這次榮登榜一的是:鴨嘴獸(Platypus 2-70B)!

和現在抱臉開源榜單上大部分的模型一樣,鴨嘴獸是來自波士頓大學的研究人員基于Llama2微調而來。

同時,鴨嘴獸的進步就像之前所有的開源大模型那樣:在提升性能的同時,使用更少的計算資源和數據。

一個13B的鴨嘴獸模型可以在單個A100 GPU使用25k個問題在5小時內完成訓練。

論文地址:https://arxiv.org/pdf/2308.07317.pdf

根據研究人員的論文描述,鴨嘴獸70B變強的原因主要是兩點:

1. 編輯數據集:刪除相似和重復的問題

2. 使用LoRA和PEFT對模型進行了優化,重點關注非注意力模塊

而在檢查測試數據泄漏和訓練數據污染方面,鴨嘴獸也做出了自己的貢獻,這為未來的研究提供了有價值的參考。

多快好省的鴨嘴獸

鴨嘴獸主要是通過在一個小而強大的數據集Open-Platypus上使用參數高效調整(PEFT)和LoRA中對非注意力部分的微調來改進模型的性能。

與一般專注于專業領域的模型在微調是耗時又昂貴不同,鴨嘴獸既做到了在總體上的模型性能提升,同時在特定領域的表現也很優秀。

在研究中發現,領域特定的數據集可以提高在所選任務類別上的性能。當與模型合并結合使用時,能夠顯著減少訓練時間。

開源數據集

研究團隊通過Hugging Face向公眾開放了鴨嘴獸的數據集Open-Platypus:

Open-Platypus由11個開源數據集組成,主要由人為設計的問題組成,只有大約10%的問題由LLM生成,能夠以最小的微調時間和成本實現強大的性能。側重于提高LLM的STEM和邏輯能力。

同時,研究團隊也對這些數據集進行了優化,這有助于縮小數據集并最大限度地減少數據冗余。

具體操作包括:

通過相似性排除的方法來最小化記憶,刪除了所有逐字逐句的重復指令,然后刪除了與訓練集中其他指令的SentenceTransformers 嵌入具有80%余弦相似度的指令。

并且默認保留具有更詳細答案的問題與答案對。因為較長的答案很可能對應更詳細的解釋和/或逐步解決方案。

解決數據污染

研究團隊深入探索了開放式LLM訓練集中的污染問題,并介紹了對鴨嘴獸數據進行過濾過程。

研究團隊數據過濾的方法,其核心是確保基準測試題不會無意中泄漏到訓練集中,這是為了防止測試數據的記憶對基準結果造成歪曲。

考慮到這一點,在確定是否應將問題標記為重復問題并從訓練集中刪除時,應留有余地。

在確定可疑問題時允許一定的靈活性,因為查詢有多種措辭方式,同時,通用領域知識可能會阻止問題被視作重復。

為此,研究團隊開發了以下啟發式方法,用于指導人工篩選來自 Open-Platypus 的、與任何基準問題相似度大于 80% 的問題。

研究團隊將潛在問題分為三類:重復、灰色區域和相似但不同。但為了謹慎起見,研究團隊會將它們全部從訓練集中刪除。

1. 重復:

這些問題幾乎是測試集問題的完全復制品,可能只有一個微小的詞語變化或輕微的重新排列。

這是我們將之定義為“真正”的污染類別,如上表中泄漏問題的數量所示。這種情況的具體示例如下:

2. 灰色區域

這組問題被稱為灰色區域,包括并非完全重復的問題,屬于常識范疇。

雖然我們將這些問題的最終評判權留給了開源社區,但我們認為這些問題往往需要專家知識。

值得注意的是,這類問題包括指令完全相同但答案卻同義的問題:

3. 相似但不同:

最后一類問題包括盡管具有較高的余弦相似性分數,但答案卻截然不同的問題。

這通常可以歸因于問題結構的細微變化,從而產生完全不同的答案。

下圖中的第一個問題就是一個很好的例子,其中對旋轉軸和象限定義的修改極大地改變了最終答案。

微調與合并模型

在完善數據集并對污染進行三重檢查后,研究團隊對模型進行了微調與合并。

方法主要是低秩逼近(LoRA)訓練和參數高效微調(PEFT)庫。

與完全微調不同,LoRA 保留了預先訓練的模型權重,并在轉換層中整合了秩分解矩陣。

這可以減少可訓練參數,并節省訓練的時間和成本。

例如,鴨嘴獸的13B模型使用1個A100 80GB進行了5個小時的微調,70B模型使用4個A100 80GB進行了22個小時的微調。

而作為比較基準,斯坦福大學對Alpaca-7B 的全面微調是在8 個 A100 80GB 上進行的,并花費了3個小時。

研究團隊對模型的微調最初主要針對的是注意力模塊,如 v_proj、q_proj、k_proj 和 o_proj。

后來,研究人員轉向了對gate_proj、down_proj 和 up_proj 模塊的微調,與注意力模塊相比,除了可訓練參數小于總參數的 0.1% 時,微調這些模塊模型的性能表現更好。

為了保持一致性,研究團隊對13B和70B模型統一采用了這一方法,可訓練參數分別為0.27%和0.2%。

唯一的差異在于這些模型的初始學習率。

研究團隊的模型合并策略則旨在評估與Instruct和Beluga等廣泛模型或Camel 等專業模型合并的協同效應。

研究團隊發現,合并模型能夠有效拓寬模型的知識基礎,但選擇何種模型進行合并,是廣泛合并還是集中合并,在決定性能結果方面起著關鍵作用。

同時,模型合并的效果因測試的具體領域而異。

所有領域的性能提升和下降并不一致,意味著在最終確定合并之前進行特定領域評估的必要性。

鴨嘴獸排名第一

截止到今天的Hugging Face開源LLM排行榜數據,Platypus2-70B依舊穩坐第一,而它的變體也在眾多LLM中排名前列。

而在13B的尺寸上,鴨嘴獸的表現也同樣亮眼,以平均分63.96脫穎而出,成為13B模型的領跑者。

Hugging Face的Open LLM排行榜

Huggingface的Open LLM排行榜目前是開源社區使用最多,同時也是參與模型最多的排行榜。

Open LLM排行榜使用Eleuther AI語言模型評估框架,這是一個在大量不同評估任務上測試生成式語言模型的統一框架,會在 4 個關鍵基準上對模型進行評估。 

1. AI2 :針對科學問題的推理測試,共有25次測試。

2. HellaSwag:常識推理測試,但對大語言模型來說具有相當的挑戰性,總共進行10次測試。

3. MMLU:用于測量文本模型的多任務準確性。該測試涵蓋 57 項任務,包括初等數學、美國歷史、計算機科學、法律等,總共測試10次。

4. TruthfulQA:用于測試模型復制網上常見虛假內容的傾向。

整個測試框架都是開源的,網友可以直接在本地用這個框架測試模型,或者提交模型給Hugging Face來在線跑分。

全世界大大小小的模型都有機會打榜,成功登頂就可以標榜自己是世界第一。

一個韓國團隊訓練的開源模型,在被鴨嘴獸超越之前曾經是世界第一。他們就很自豪地將這個成果展示在公司主頁最矚目的地方。

Hugging Face的Open LLM排行榜,不僅能讓技術人員客觀對比模型的能力,還能給開源社區模型提供一個展示自己以獲取外部資源,最終進一步發展的機會。

這也與開源社區的宗旨一致:

秉持高性價比的理念,允許各種改進模型的嘗試,擁抱開放和共同進步.....

也許這就是開源社區如此生機勃勃的原因。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-09 12:56:17

AlpacaWizardLMVicuna

2024-09-26 10:42:20

2023-07-22 13:09:51

模型開源

2023-08-17 11:34:55

模型AI

2023-06-02 13:55:57

開源AI

2023-08-14 13:29:37

2020-03-18 13:21:50

人工智能機器學習技術

2023-06-07 14:08:00

計算機代碼

2024-06-19 11:45:34

2013-08-23 09:41:19

2024-12-05 13:50:00

AI大模型

2014-11-26 09:40:02

編程語言Ruby

2024-06-21 08:42:54

BERTNLP自然語言處理

2018-08-17 06:01:46

工業物聯網IIoT物聯網

2025-05-07 13:51:49

模型數據

2014-11-26 10:49:32

編程語言

2024-05-30 14:23:00

2023-10-08 09:00:00

LLMGitHub人工智能

2013-04-19 10:17:57

波士頓馬拉松爆炸的大數據大數據全球技術峰會

2013-05-09 10:31:10

點贊
收藏

51CTO技術棧公眾號

韩日av一区二区| 亚洲人线精品午夜| 蜜桃传媒九九九| 99这里都是精品| 日本xxxxxxxxxx75| 成人毛片老司机大片| 成人一级生活片| 国产精品一级在线| 超碰超碰超碰超碰超碰| 国模一区二区三区白浆| 麻豆映画在线观看| 成人动漫一区二区| 无码精品a∨在线观看中文| 国产一区二区三区四区五区入口| 97在线观看免费观看高清| 精品成人免费观看| 免费中文日韩| 日韩精品电影一区亚洲| 欧美日韩一区二区三区在线观看免 | 最近久乱中文字幕| 欧美视频裸体精品| 久久久久美女| 欧美v亚洲v综合v国产v仙踪林| 天堂…中文在线最新版在线| 亚洲福利一区二区三区| 成人无号精品一区二区三区| 影音先锋导航| 日韩免费视频一区二区| 婷婷精品久久久久久久久久不卡| 欧美高清视频在线播放| 欧美偷窥清纯综合图区| 福利视频一区二区三区| 日本女优在线视频一区二区| 人妻互换免费中文字幕| 国产精品久久久久久久久免费樱桃| 国产超碰在线| yellow中文字幕久久| 欧美日本一区| www黄色在线| 欧美日韩色婷婷| 亚洲黄色中文字幕| 国产精品网站视频| 蜜桃久久av一区| 色婷婷狠狠18| 中文乱码免费一区二区| 国产卡一卡二在线| 成人黄色小视频在线观看| www.91在线| 国产真实精品久久二三区| 日韩在线观看免费全| 九九视频精品全部免费播放| 欧美12av| 国产精品麻豆99久久久久久| 免费黄网在线观看| 99热在线成人| 杨幂毛片午夜性生毛片| 欧美一区二区在线视频| 欧美另类视频| 亚洲人成色77777| 超碰91人人草人人干| 91丨九色丨尤物| 成人免费视频观看视频| 国产一区二区三区高清播放| 亚州av影院| 亚洲精品一区在线观看| 美女毛片一区二区三区四区| 一本一生久久a久久精品综合蜜| 亚洲天堂免费在线观看视频| 免费毛片b在线观看| 91精品国产自产在线老师啪| 国产精品888| 91精品国产91久久久久游泳池 | 波多野结衣在线| 精品亚洲精品福利线在观看| 欧美一二区在线观看| 成人女性视频| 中文字幕在线第一页| 久久全球大尺度高清视频| 在线一区免费| 色网址在线观看| 国产成人av网| 国产丝袜欧美中文另类| 欧美日韩精品免费观看| 福利一区二区在线观看| 欧美日韩在线资源| 国产精品网站大全| a级精品国产片在线观看| 黄色片在线免费看| av在线亚洲男人的天堂| 中文字幕一区电影| 国产一区久久| 日韩免费视频播放| 亚洲免费伊人电影在线观看av| 在线亚洲a色| 北条麻妃高清一区| 粉嫩av一区二区三区| 爆操欧美孕妇| 中文字幕亚洲欧美一区二区三区 | 日韩欧美一级| free亚洲| 成年免费网站| 精品高清一区二区三区| 日韩影片在线观看| 99久热在线精品视频| 欧美日韩高清影院| 欧美黄色大片网站| 日本大片在线观看| 国产精品网站大全| xxxxxxxxx欧美| 在线不卡中文字幕播放| 亚洲国产va精品久久久不卡综合| 亚洲精品女人| 成人免费在线电影网| 亚洲综合色视频在线观看| 一本色道久久99精品综合| 欧美怡红院视频一区二区三区 | 日韩毛片在线免费看| 亚洲国产精品999| 奇米影视7777精品一区二区| av毛片在线| 鲁丝一区二区三区免费| 欧美色倩网站大全免费| 国产精品mv在线观看| 九九九伊在人线综合| 91嫩草在线| 欧美福利一区二区| 日韩二区三区四区| 国产精品伦理| 欧美亚洲另类色图| 99re国产| 欧美色另类天堂2015| 欧美日韩在线网站| 黄色av网站在线| 久久人人九九| 亚洲第一免费播放区| 极品美女销魂一区二区三区| 91精品影视| 热久久精品免费视频| 青青久久aⅴ北条麻妃| 欧美色另类天堂2015| 欧美亚洲视频| 中文不卡1区2区3区| 亚洲午夜无码av毛片久久| 久久久亚洲影院| 亚洲资源在线观看| 欧美日韩国产一区精品一区| 国产精品蜜臀| 116极品美女午夜一级| 4438全国成人免费| 91久久国产综合久久| 男人的天堂在线视频| 中文字幕成人在线视频| 久草综合在线| 亚洲3区在线| 久久er热在这里只有精品66| 波多野结衣亚洲| 吞精囗交69激情欧美| 国产韩日精品| 久久久91麻豆精品国产一区| 精品一区电影| 亚洲午夜精品视频| 97久久超碰国产精品电影| 91爱视频在线| 日韩视频在线直播| 日本福利视频| 狠狠干一区二区| 亚洲日韩第一页| 国产精品久线观看视频| 欧美在线免费一级片| 午夜不卡影院| aaa一级毛片| 麻豆91蜜桃| 国产伦理精品不卡| 欧美国产综合色视频| 亚洲成av人片在线观看| 国产精品情趣视频| 国产综合色在线| 欧美极品第一页| 亚洲综合色视频| 欧洲一区二区在线| 亚洲精品成人a8198a| 轻轻色免费在线视频| 国产成人av电影在线| 亚洲一区999| 91色|porny| 亚洲黑丝一区二区| 欧洲大片精品免费永久看nba| 男人的天堂在线视频| 成人小视频在线看| 欧美xxxx黑人又粗又长密月| 97国产精品免费视频| 国产一区二区久久| 国产精品乱人伦| 国产成人精品999| 激情五月开心婷婷| 4438x成人网全国最大| 欧美女优在线视频| 粉嫩久久99精品久久久久久夜| 欧美亚洲日本国产| 成人激情电影一区二区|