国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)

發(fā)布于 2024-9-12 11:34
瀏覽
0收藏

一、背景

我們之前介紹過一些 LLM 模型融合或堆疊的方案,然而這些方案通常需要人工設(shè)計(jì)或者繼續(xù)訓(xùn)練、微調(diào),這里我們介紹一篇新的工作試圖解決這些問題,其思路很有意思,為后續(xù)的模型生產(chǎn)提供了一條思路,也得到了意想不到的結(jié)果。

需要說明的是,雖然開源了代碼,單開源代碼中并沒有開放如何合并的代碼,導(dǎo)致合并的細(xì)節(jié)無法獲知。此外,相應(yīng)的代價(jià)有多高也沒有具體介紹,比如評估成本。

對應(yīng)的論文為:[2403.13187] Evolutionary Optimization of Model Merging Recipes

對應(yīng)的代碼庫:?https://github.com/SakanaAI/evolutionary-model-merge??

對應(yīng)的官網(wǎng):?https://sakana.ai/evolutionary-model-merge/??

二、摘要

論文中,作者將進(jìn)化算法應(yīng)用到 LLM 模型融合場景,通過自動發(fā)現(xiàn)各種開源模型的有效組合,充分利用它們已有的知識,在不需要額外訓(xùn)練的情況下獲得了不錯的效果。具體來說,作者通過參數(shù)空間融合(parameter space,PS)和數(shù)據(jù)流空間融合(data flow space,DFS)相結(jié)合的方式獲得新的融合模型。這種方式甚至可以實(shí)現(xiàn)跨領(lǐng)域合并,作者基于日語模型和英語數(shù)學(xué)模型生成了日語數(shù)學(xué)模型,在各種模型上獲得了 SOTA 性能。此外也在 VLM(Vision Large Model)和圖像生成模型上進(jìn)行了驗(yàn)證,獲得不錯的結(jié)果。

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

三、方法

3.1 參數(shù)空間融合

參數(shù)空間融合在之前的方案中已經(jīng)有比較多介紹,其核心就是將具有相同模型結(jié)構(gòu),但是針對不同任務(wù)或場景的模型在同一 Transformer 層按照加權(quán)平均的方式直接合并模型參數(shù)。(混合權(quán)重可以通過進(jìn)化算法來學(xué)習(xí),比如 CMA-ES)

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

比如,在 [2311.07575] SPHINX: The Joint Mixing of Weights, Tasks, and Visual Embeddings for Multi-modal Large Language Models 中,作者提出了將不同領(lǐng)域微調(diào)模型融合的策略,如下圖所示,作者驗(yàn)證了直接混合 LLM 的效果(GitHub - Alpha-VLLM/WeMix-LLM):

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

3.2 數(shù)據(jù)流空間融合

數(shù)據(jù)流空間融合是指將多個(gè)模型的 Transformer 層直接堆疊到一起進(jìn)行融合,但這種方式往往是人工確定融合方案,而且往往需要再次訓(xùn)練或者微調(diào),以彌補(bǔ)不同模型分布不一致導(dǎo)致的性能下降:

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

這種方式有點(diǎn)類似 [2312.15166] SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling 中的堆疊方式,具體來說:

  • Step 1-1:將原始 LLM 復(fù)制一份,假設(shè)包含 n 層 Transformer Block(n=32)。
  • Step 1-2:刪除原始模型的后 m 層,和副本模型的前 m 層(m=8),并將兩個(gè)新的模型拼接在一起,新的模型包含 2*(n-m)=48 層 Transformer Block。
  • Step 2:在新的模型上繼續(xù)預(yù)訓(xùn)練。?

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

本文的主要工作是通過引入進(jìn)化算法來避免龐大的人工組合代價(jià)。假設(shè)多個(gè)候選模型,總共有 M 個(gè) Transformer 層,需要組合的模型包含 T 個(gè) Transformer 層,則相應(yīng)的組合空間為 (M+1)T,其中的 1 表示當(dāng)前已組合的模型,M 表示每次都可以從 M 層中選一個(gè),可以重復(fù)。假設(shè)有 2 個(gè) 32 層的模型組合為一個(gè) 48 層的模型,相應(yīng)的變種為 (64+1)48,空間非常大,幾乎不現(xiàn)實(shí)。

所以核心問題就是如何降低上述的搜索空間。作者發(fā)現(xiàn),部分層組合方式可能對模型產(chǎn)生不利的影響,比如重復(fù)/交換模型比較靠前的一些層(PS:這里介紹不多,比較困惑)。基于這個(gè)發(fā)現(xiàn),作者構(gòu)建了一個(gè)層索引數(shù)組 L,其大小為 T=Mxr,其中 r 表示重復(fù)的次數(shù)。這個(gè)數(shù)量 L 表明:將模型的層按照順序排列,一個(gè)模型的層順序不變,然后一個(gè)模型接一個(gè)模型,類似(模型1:第1層,第2層,。。。),(模型2:第1層,第2層,。。。),然后將上述序列重復(fù) r 次。如果 Li > 0,則表示使用對應(yīng)的層,否則不使用,這樣對應(yīng)的搜索空間為 2T。(PS:這樣是不是意味著評估的代價(jià)也很高,比如 MGSM accuracy 和 VQA ROUGE 等指標(biāo)都要在相應(yīng)的模型里面評估一次,無法按照每層評估。)

PS:這兩個(gè)地方的 T 含義是否相同,比如是否表示最終要生成模型的層數(shù) T?

  • 如果一樣,那 T 可能并不會特別大,比如 2 個(gè) 32 層的模型組合為一個(gè) 48 層的模型,則對應(yīng)的 r 為 0.75,此時(shí) L 無法與所有 M 層對應(yīng)。
  • 如果不一樣,T 通常大于 M,比如為 2,則如何保證生成特定層數(shù)的模型?

此外,作者觀察到,如果交換相鄰 Transformer 層的順序,會使性能下降,但是對輸入增加一定的 Scaling 可以緩解這一問題。基于此,作者構(gòu)建了一個(gè)權(quán)重矩陣 Wi,j,大小為 (M, M),表示任意兩層相連的 Scaling 因子。

綜上,作者確定了兩個(gè)優(yōu)化參數(shù),L 和 W,使用進(jìn)化算法搜索完即可以合并模型。

3.3 參數(shù)空間+數(shù)據(jù)流空間融合

那么如何將上述兩種方案融合呢?作者的思路也很簡單:

  1. 首先使用參數(shù)空間融合策略獲得一個(gè)合并的模型。
  2. 將候選模型和合并的模型一起作為候選模型。
  3. 基于以上模型進(jìn)行數(shù)據(jù)流空間融合。

四、評估

如下圖 Table 1 所示,Shisa Gamma 7B v1 為日語通用模型,WizardMath 7B v1.1 和 Abel 7B 002 都是英語數(shù)學(xué)模型,它們都是基于 Mistral 7B v0.1 微調(diào)而來。4 和 5 表明,PS 和 DFS 能有效幫助提升模型的日語數(shù)學(xué)能力,將 PS+DFS 結(jié)合可以在 MGSM-JA 指標(biāo)上進(jìn)一步改善,但 JP-LMEH 指標(biāo)相比 PS 略有降低,證明了方案的有效性。

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

如下圖 Table 2 所示,作者也進(jìn)一步證明提出的策略不會導(dǎo)致已有能力的衰退:

LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)

如下圖 Table 3 所示,作者也在 VLM 上進(jìn)行了驗(yàn)證,獲得了不錯的效果:


LLM 合并新思路:進(jìn)化算法+零訓(xùn)練->新任務(wù)-AI.x社區(qū)


五、參考鏈接

  1. ???https://arxiv.org/abs/2403.13187???
  2. ???https://github.com/SakanaAI/evolutionary-model-merge???
  3. ???https://sakana.ai/evolutionary-model-merge/????

本文轉(zhuǎn)載自 ??AI閑談??,作者: AI閑談

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
日韩一区二区在线观看视频 | 林ゆな中文字幕一区二区| 国产亚洲欧美激情| 欧美日韩一区二区视频在线观看 | 免费在线性爱视频| 国产成人啪午夜精品网站男同| 国产精品久久9| www.久久爱.com| 在线不卡a资源高清| 毛片.com| 国产亚洲成aⅴ人片在线观看 | 日韩av网址大全| 日韩毛片中文字幕| 国产精品秘入口| 成人欧美一区二区三区白人| 韩国黄色一级大片| 欧美日韩国产精品一区二区亚洲| 色综合久久天天综线观看| 日本小视频在线免费观看| 香蕉影视欧美成人| 成人18免费入口| 91片黄在线观看| 中国老女人av| 日韩国产成人精品| 国内一区二区三区在线视频| 性欧美lx╳lx╳| 欧美精品激情在线观看| 少妇淫片在线影院| 欧美va在线播放| 日韩精品黄色| 欧洲在线/亚洲| 香蕉视频免费在线| 亚洲精品写真福利| 欧美18 19xxx| 国产精品久久毛片| 中文字幕天天干| 91麻豆国产精品久久| 欧美视频在线观看视频| 国产精品自在在线| 91国内在线| 精品一区电影国产| 亚洲mv在线| 亚洲国产精品高清| 2019一级黄色毛片免费看网| 亚洲国产中文字幕在线视频综合| 亚洲va电影大全| 成人激情自拍| 久久99精品久久久久久琪琪| 成人免费91| 欧美精品在线看| aaa国产精品| 69久久夜色精品国产69乱青草| 亚洲天堂av资源在线观看| 久久成人精品一区二区三区| 香蕉大人久久国产成人av| 97涩涩爰在线观看亚洲| 麻豆一区二区麻豆免费观看| 欧美做受高潮1| 成人在线免费观看91| 国产精品久久久久久搜索| 欧美系列电影免费观看| 91精品在线观看视频| 亚洲成人原创| 日韩视频在线免费播放| 99视频超级精品| www.av99| 日韩欧美精品在线观看| 成年人黄视频在线观看| 亚洲激情在线观看视频免费| 少妇精品视频一区二区免费看| 欧美激情中文字幕乱码免费| 亚洲美女15p| 岛国一区二区三区高清视频| 日韩av二区在线播放| 懂色av粉嫩av蜜臀av| 久久久激情视频| 黄色直播在线| 欧美精选一区二区| 视频在线日韩| 欧美在线不卡区| 欧美久久视频| 日本香蕉视频在线观看| 亚洲欧美在线视频| jizzjizz在线观看| 国产亚洲精品va在线观看| 美国十次av导航亚洲入口| 国产精品国产三级欧美二区| 九一九一国产精品| 伊人影院综合在线| 欧美肥妇毛茸茸| 91精品亚洲一区在线观看| 91麻豆桃色免费看| 视频在线观看91| 欧美性猛交久久久乱大交小说| 婷婷成人综合网| 国产夫妻在线播放| 国产综合在线视频| 亚洲国产高清一区| 午夜精品久久久久久久无码| 精品久久久免费| 欧美一级大片| 91精品视频免费| 国产成人aaaa| 国产午夜在线视频| 久久精品91久久久久久再现| 亚洲成人日韩| 国产av人人夜夜澡人人爽麻豆 | 日本在线电影一区二区三区| 欧美日韩精品免费观看视一区二区| 成人黄色av网站在线| 欧洲天堂在线观看| 久久伊人精品天天| 石原莉奈在线亚洲二区| 免费观看v片在线观看| 亚洲欧美自拍一区| 欧美在线1区| 久久精品网站视频| 亚洲国产日韩欧美综合久久| 日韩欧美中字| 亚洲色精品三区二区一区| 91精品国产综合久久久久久| 久久av资源| 国模吧无码一区二区三区 | 日韩激情网站| 性刺激综合网| 无码av免费一区二区三区试看| 免费污视频在线一区| 国产精品免费一区二区| 国产精品久久久久三级| 亚洲人体影院| 懂色中文一区二区三区在线视频| 日本一区二区免费在线| 国模精品视频| 激情视频在线观看一区二区三区| 亚洲视频一区二区在线| 伊人国产精品| 轻点好疼好大好爽视频| 日韩欧美一二区| 亚洲美女视频在线免费观看| 三级在线观看| 国产精品影片在线观看| 国产色91在线| 亚洲精品三区| www.亚洲一区二区| 欧美一卡二卡三卡| 国产精品mv在线观看| 日本一区二区三区电影| 午夜精品久久久久久久白皮肤| 国产成人亚洲精品青草天美| а√在线中文网新版地址在线| 明星裸体视频一区二区| 欧美日韩三级在线| 午夜精品偷拍| 久热av在线| 成人综合色站| 欧美综合在线视频| 亚洲图片在线| 国产在线你懂得| 成人一区二区在线| 欧美日韩美少妇| 亚洲激精日韩激精欧美精品| 欧美黑人激情| 日韩视频在线播放| 亚洲国产日韩欧美综合久久| 久久超碰97人人做人人爱| 韩国成人二区| 天天做天天躁天天躁| 色噜噜狠狠狠综合曰曰曰88av| 91美女片黄在线观看91美女| 日本亚洲视频| 日韩黄色动漫| 亚洲伊人久久综合| 91精品国产综合久久福利| 免费激情视频在线观看| 亚洲成av人片乱码色午夜| 美臀av在线| 国产噜噜噜噜久久久久久久久| 欧美色播在线播放| 99在线精品视频在线观看| 日本不卡1234视频| 国自产拍偷拍精品啪啪一区二区| www高清在线视频日韩欧美| 国产亚洲一区字幕| 欧美日韩夜夜| 国产精品一区在线看| 欧美久久久久久| 亚洲欧美一区二区三区在线| 91蜜桃在线观看| 蜜臀91精品国产高清在线观看| 亚洲高清国产精品| 国产欧美在线一区二区| 日韩精品久久久久久福利| 91老师国产黑色丝袜在线| 精品一区亚洲| 第三区美女视频在线| 亚洲欧洲精品一区| 国语自产精品视频在免费| 欧美亚洲禁片免费| 成人免费高清在线| 欧美日一区二区|