国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

8B尺寸達到GPT-4級性能!北大等提出醫療專家模型訓練方法

人工智能
本文研究發現大語言模型在持續預訓練過程中出現目標領域性能先下降再上升的現象。本文引入「穩定性差距」概念來解釋該現象,并提出了三種策略來緩解問題。首先,本文提出在適當大小的數據子集上進行多輪預訓練,能比單輪大數據集預訓練更快的性能恢復。其次,應選取最高質量的子語料進行多輪預訓練。最后,通過混合數據來接近預訓練數據分布。這些策略在醫療領域的持續預訓練和指令精調中均顯著提升效果和削減計算量。

大規模語言模型(LLMs)的持續預訓練是提升其在特定領域性能的重要方法。通過在新領域的語料庫上預訓練大語言模型,這一過程能夠顯著增加模型的領域知識儲備和任務能力。

然而,盡管已有許多研究探討了從頭預訓練的LLMs的學習機制和性質,關于持續預訓練過程中LLMs行為的研究卻相對較少。

最近北京大學、香港科技大學等開源了一個8B醫學大模型,通過測試模型在連續預訓練和指令微調實驗過程中的表現變化,發現了許多有趣的現象。

圖片圖片

論文鏈接:https://arxiv.org/abs/2406.14833

開源地址:https://huggingface.co/YiDuo1999/Llama-3-Physician-8B-Instruct

先下降后上升: 模型訓練中存在的穩定性缺失問題  

本文首先選取TinyLLaMa-1b 和OpenLLaMA-3b模型作為基座模型,并在5百億醫療tokens上做做連續單輪預訓練。在預訓練過程中,作者每隔5b測試一次模型在醫療維基語料上的困惑度(PPL)和下游醫療任務的平均表現。

如圖1 所示,盡管模型在醫療維基語料上的困惑度持續下降(圖1b),但在連續預訓練初期,模型在醫學任務上的表現卻出現了下降 (圖1a)。隨著更多數據的訓練,任務表現逐漸恢復并超過了原始模型的水平 。

圖片圖片

圖1:(a)預訓練過程中模型在四個醫療QA任務上的平均表現(b)預訓練過程中模型在醫療維基語料上的困惑度

為了解釋表現先下降后上升的行為,我們借鑒了持續學習中的穩定性差距概念。基于它的解釋,醫療任務表現最初下降是因為學習新領域的可塑性梯度超過了維持通用任務能力的穩定性梯度,導致未能維持醫療任務的性能。隨后,任務損失增強了穩定性梯度,這一前后穩定性差距最終導致性能恢復并上升。

為了驗證以上假設,我們進一步測試了模型在醫療持續預訓練中的通用任務表。如圖2顯示,一般任務性能呈現類似的V形曲線,表明一般指令跟隨能力在最初下降后恢復。

圖片圖片

圖2:預訓練過程中模型在10個常識和閱讀理解任務上的平均表現

  三個針對穩定性差距的訓練策略 

為了克服持續預訓練中存在的穩定性差距問題,本文提出了三種有效策略:

策略1:在適當大小的數據子集上進行多輪預訓練,而不是在大數據集上進行單輪預訓練。這種策略減少了每次預訓練所需的高可塑性梯度,促進了穩定性梯度的上升,進而加速了性能恢復。

策略2:僅在高質量的子語料庫上進行預訓練,以快速提升特定領域的性能。

策略3:按照預訓練數據分布采取其它來源的數據并和醫療高質量數據混合訓練,減少預訓練分布和連續預訓練差距,促進模型穩定性梯度的形成。

圖片

表1:在醫療預訓練完成后模型在四個醫療任務上的zero-shot表現

實驗結果:本文通過對比多種基線方法來驗證提出的三條策略的有效性, 其中包括500億醫療數據單輪訓練、學習率Re-warming and Re-decaying、重采樣和參數固定等基線。

如下表1所示,基于本文的策略,OpenLLaMa模型只需要在高質量50億數據上訓練4個輪次(即原計算預算的40%),便可以在醫療任務平均表現上顯著超越了所有基線,尤其在PubMedQA等醫學問答任務中表現突出。

面向GPT4水平的8B醫療專家模型  

連續預訓練:本文按照提出的三種策略對Llama-3-8B模型做進一步的醫療連續預訓練。在這個過程中使用了50億高質量醫學數據,并對模型做四個輪次的重復訓練。

指令微調:連續預訓練完成后,本文采用多個類型的醫療任務指令對模型做指令微調,包括問答任務、分類任務、關系提取任務、自然語言推理任務和總結任務。

微調過程中,研究團隊繼續采用提出的三種策略來優化指令微調效果。首先是多輪次訓練,這在醫學指令微調過程中是常見的。其次,利用Deita自動指令數據選擇器,選擇高質量的醫學指令數據子集。最后,使用高質量的通用指令數據集,如Airoboros-3.2,以緩解模型在通用任務完成能力上的遺忘。

圖片圖片

圖3:指令微調過程中模型的醫療平均表現

如圖3所示,在指令微調過程中,使用所有數據做微調仍然可能在初始訓練階段時面臨表現下降問題。而通過我們的三種策略,模型僅需25%的指令數據就能達到最佳性能,這降低了計算資源的消耗。

實驗比較:本文進一步將達到最佳表現的指令微調模型Llama-3-Physician-8B-insturct與其它醫療模型比較。如表2所示,Llama-3-Physician-8B-insturct在醫療問答任務上明顯優于其它同尺寸的開源模型,并且超過了閉源的GPT-3.5-turbo模型。同時,它的平均醫療問答任務表現也接近GPT-4.

圖片圖片

表2:指令微調結束后各模型在四個醫療問答任務上的zero-shot表現

本文進一步考慮Llama-3-Physician-8B-insturct在其它類型(非問答)的醫療任務上的表現。如表3所示,Llama-3-Physician-8B-insturct在醫療分類,關系抽取,推理和總結任務上都取得了優異表現,且明顯超過GPT-4表現。

圖片圖片

表3:指令微調結束后各模型在醫療分類,關系抽取,推理和總結任務上的zero-shot表現

總結  

1. 本論文研究了在對LLMs(大語言模型)進行新領域語料庫的連續預訓練時的行為,并觀察到模型初始性能下降,隨后緩慢恢復的現象。本文使用穩定性差距這一概念來描述這一現象,并從可塑性和穩定性梯度的角度對此解釋

2. 本文進一步提出了三種有效提高LLM在特定領域表現并降低計算成本的策略,從而克服穩定性差距。這些策略包括:在適當大小的數據子集上進行多輪預訓練,選取高質量子集和按預訓練數據分布混合采樣數據。

3. 本文將這些策略應用于最新的Llama-3-8B模型的連續預訓練和指令微調過程中,所得到的Llama-3-Physician-8B-insturct不僅在同規模開源模型中表現最強,并且優于閉源的GPT-3.5模型,接近GPT-4的表現。

參考資料:

https://arxiv.org/abs/2406.14833

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-06-17 18:04:38

2023-08-11 13:34:06

GPT-4訓練

2024-12-02 14:20:00

模型訓練

2024-02-07 12:13:03

AI模型

2025-12-02 01:22:00

NVIDIAGPT-5小模型

2023-07-13 12:54:42

GPT-4OpenAI

2025-10-10 01:00:00

8B模型GPT-4oAgent

2023-06-05 12:32:48

模型論文

2023-06-19 08:19:50

2024-06-17 12:39:37

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2025-12-08 08:42:00

2024-04-26 07:48:45

DockerLLama3模型

2023-11-07 18:08:03

GPT-4模型

2025-04-16 09:35:03

2024-02-02 17:04:35

UCLALLMGPT-4

2025-07-14 09:00:00

2023-06-08 11:27:10

模型AI

2023-03-30 11:08:49

AI模型訓練

2025-01-02 13:00:00

點贊
收藏

51CTO技術棧公眾號

国产精品久久久久久久久久齐齐| 警花av一区二区三区| 99精品欧美一区二区三区综合在线| 国产精品一区二区三| 精品亚洲a∨| 日韩精品一区二区视频| 国产91porn| 色综合网站在线| 国产精品免费播放| 日本欧美中文字幕| 国内精品视频666| 亚洲免费一级视频| 国产精品久久久久久久裸模| 新呦u视频一区二区| 午夜亚洲福利在线老司机| 自拍亚洲一区欧美另类| 97视频久久久| 91啪亚洲精品| 亚洲一区二区久久久久久| 欧美日韩免费观看视频| 亚洲午夜免费电影| 日韩视频 中文字幕| 在线精品一区二区| 国产一区精品在线| 高潮按摩久久久久久av免费| 日韩av在线高清| av片在线观看永久免费| 久久韩剧网电视剧| 风间由美一区二区av101| 国产日韩欧美在线播放| 国产日韩三级在线| 成人欧美一区二区| 成人欧美一区二区三区白人| 日韩肉感妇bbwbbwbbw| 欧美日一区二区在线观看| 久久久精品国产一区二区| wwwww在线观看免费视频| 亚洲欧洲一区二区在线播放| 精品一区二区三区毛片| 欧美精品日韩| 污网站在线观看免费| 在线观看日产精品| 在线观看日韩| 欧美日韩精品综合| 欧美电影网站| 91黄在线观看| 久久精品久久综合| 中文字幕第21页| 国产日产精品一区| 黄页在线播放| 国产一区不卡在线观看| 中文字幕一区二区日韩精品绯色| 漂亮人妻被中出中文字幕| 亚洲欧美成人网| 丁香啪啪综合成人亚洲小说| 成人三级小说| 国产精品99久久久久久久vr| 国产精品视频一区二区三区四区五区| 亚洲精品乱码久久久久| 成年网站在线免费观看| 日韩av午夜在线观看| 日韩午夜视频在线观看| 欧洲亚洲精品在线| 欧美午夜在线播放| 嫩草视频在线观看| 在线亚洲免费视频| 免费观看不卡av| 欧美xxx黑人xxx水蜜桃| 日韩欧美一区二区三区四区五区| 欧美精品第1页| 日韩av有码| www.九色.com| 日韩精品电影网| 欧美视频免费看| 久久国产色av| 久久经典视频| 亚洲午夜精品在线| 影音先锋在线亚洲| 在线电影一区二区| 久久av一区二区| 999久久久国产精品| 欧美高清性hdvideosex| 情se视频网在线观看| 亚洲韩国日本中文字幕| 国产丝袜一区| 成人免费在线观看网站| 亚洲欧美国产精品专区久久| 亚洲国产毛片aaaaa无费看| 99a精品视频在线观看| igao视频网在线视频| 好吊色欧美一区二区三区视频| 偷拍日韩校园综合在线| 91在线超碰| 在线观看视频污| 91精品入口蜜桃| 色综合天天视频在线观看| 免费高清不卡av| 中文在线天堂网| 色噜噜一区二区| 亚洲蜜臀av乱码久久精品| 国产盗摄精品一区二区酒店| 国产精品观看在线亚洲人成网| 国产精品影视在线观看| 无遮挡动作视频在线观看免费入口| 青青草成人在线| wwwwxxxxx欧美| 北岛玲heyzo一区二区| 精品久久久久久一区二区里番| 亚洲综合网站在线观看| 日韩欧美中文在线观看| 一区二区在线观看网站| 91国偷自产一区二区三区观看| 秋霞蜜臀av久久电影网免费| 分分操这里只有精品| 日韩成人av一区| 亚洲综合精品四区| 国产视频第一区| 亚洲一区二区三区香蕉| 亚洲高清久久久| 日韩成人精品一区二区| 嫩草影院网站在线| 翔田千里一区二区| 亚州黄色一级| 国产精品私拍pans大尺度在线| 一色桃子久久精品亚洲| 久久午夜影院| 成人午夜天堂| 国产精品久久999| 亚洲一区二区三区激情| 成人激情诱惑| bdsm精品捆绑chinese女| 日韩免费观看高清| 亚洲精品欧美二区三区中文字幕| 精品精品精品| av激情网站| 成人www视频在线观看| 亚洲成av人综合在线观看| 自拍自偷一区二区三区| 偷偷要色偷偷| 成人免费视频网| 色诱亚洲精品久久久久久| 午夜日韩视频| 国内外激情在线| 亚洲成人自拍| 国产亚洲精品va在线观看| 99久久国产综合精品色伊| 欧美a在线观看| 激情四房婷婷| 99精品国产高清一区二区| 91福利在线观看| 免费在线成人| 在线一区高清| 91超碰中文字幕久久精品| 99视频精品在线| 久久香蕉网站| 无线免费在线视频| 久久综合精品一区| 精品呦交小u女在线| 99久久久无码国产精品| 亚洲精品天堂| 欧美jizzhd69巨大| 神马一区二区影院| 欧美猛男性生活免费| 欧美麻豆久久久久久中文| 久久综合影视| 日本成人三级电影| 九色porny91| 亚洲qvod图片区电影| 精品国产人成亚洲区| 久久久久国产精品厨房| 99热在线成人| 捆绑调教日本一区二区三区| 久久这里只精品| 国产免费一区二区三区| 中文字幕一区日韩电影| 香港成人在线视频| 国产在线精品免费| 国产一区日韩| 国产黄大片在线观看| 蜜桃传媒av| 亚洲高清精品中出| 青青久久av北条麻妃海外网| 欧美一区二区三区在线视频| 久久久久国色av免费看影院| 国自产拍偷拍福利精品免费一| 乡村艳史在线观看| 在线看片线路1| 成人免费播放器| 国产日本一区二区三区| 欧美大片免费观看在线观看网站推荐| 91精品福利视频| 久久精品人人做人人爽97| 欧美在线二区| 精品一区二区三区亚洲| av免费在线免费| 满满都是荷尔蒙韩剧在线观看| 久无码久无码av无码| 久久青青草综合| 国产精品香蕉av| 欧美激情视频在线观看|