国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

機(jī)器學(xué)習(xí) | 從0開始大模型之模型LoRA訓(xùn)練

人工智能 機(jī)器學(xué)習(xí)
LoRA 的背后的主要思想是模型微調(diào)期間權(quán)重的變化也具有較低的內(nèi)在維度,具體來說,如果W??代表單層的權(quán)重,ΔW??代表模型自適應(yīng)過程中權(quán)重的變化,作者提出ΔW??是一個(gè)低秩矩陣,即:rank(ΔW??) << min(n,k) 。

1、LoRA是如何實(shí)現(xiàn)的?

在深入了解 LoRA 之前,我們先回顧一下一些基本的線性代數(shù)概念。

1.1、秩

給定矩陣中線性獨(dú)立的列(或行)的數(shù)量,稱為矩陣的秩,記為 rank(A) 。

  • 矩陣的秩小于或等于列(或行)的數(shù)量,rank(A) ≤ min{m, n}
  • 滿秩矩陣是所有的行或者列都獨(dú)立,rank(A) = min{m, n}
  • 不滿秩矩陣是滿秩矩陣的反面是不滿秩,即 rank(A) < min(m, n),矩陣的列(或行)不是彼此線性獨(dú)立的

舉個(gè)兩個(gè)秩的例子:

不滿秩不滿秩

滿秩滿秩

1.2、秩相關(guān)屬性

從上面的秩的介紹中可以看出,矩陣的秩可以被理解為它所表示的特征空間的維度,在這種情況下,特定大小的低秩矩陣比相同維度的滿秩矩陣封裝更少的特征(或更低維的特征空間)。與之相關(guān)的屬性如下:

  • 矩陣的秩受其行數(shù)和列數(shù)中最小值的約束,rank(A) ≤ min{m, n};
  • 兩個(gè)矩陣的乘積的秩受其各自秩的最小值的約束,給定矩陣 A 和 B,其中 rank(A) = m 且 rank(A) = n,則 rank(AB) ≤ min{m, n};

1.3、LoRA

LoRA(Low rand adaption) 是微軟研究人員提出的一種高效的微調(diào)技術(shù),用于使大型模型適應(yīng)特定任務(wù)和數(shù)據(jù)集。LoRA 的背后的主要思想是模型微調(diào)期間權(quán)重的變化也具有較低的內(nèi)在維度,具體來說,如果W??代表單層的權(quán)重,ΔW??代表模型自適應(yīng)過程中權(quán)重的變化,作者提出ΔW??是一個(gè)低秩矩陣,即:rank(ΔW??) << min(n,k) 。

為什么?模型有了基座以后,如果強(qiáng)調(diào)學(xué)習(xí)少量的特征,那么就可以大大減少參數(shù)的更新量,而ΔW??就可以實(shí)現(xiàn),這樣就可以認(rèn)為ΔW??是一個(gè)低秩矩陣。

實(shí)現(xiàn)原理ΔW??是一個(gè)更新矩陣,然后ΔW??根據(jù)秩的屬性,又可以拆分兩個(gè)低秩矩陣的乘積,即:B?? 和 A?? ,其中 r << min{n,k} 。這意味著網(wǎng)絡(luò)中權(quán)重 Wx = Wx + ΔWx = Wx + B??A??x,由于 r 很小,所以 B??A?? 的參數(shù)數(shù)量非常少,所以只需要更新很少的參數(shù)。

LoRALoRA

2、peft庫

LoRA 訓(xùn)練非常方便,只需要借助 https://huggingface.co/blog/zh/peft 庫,這是 huggingface 提供的,使用方法如下:

# 引入庫
from peft import get_peft_model, LoraConfig, TaskType

# 創(chuàng)建對應(yīng)的配置
peft_config = LoraConfig(
    r=8,
    lora_alpha=16,
    target_modules=["q", "v"],
    lora_dropout=0.01,
    bias="none"
    task_type="SEQ_2_SEQ_LM",
)

# 包裝模型
model = AutoModelForSeq2SeqLM.from_pretrained(
    "t5-small",
)
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()

LoraConfig 詳細(xì)參數(shù)如下:

  • r:秩,即上面的r,默認(rèn)為8;
  • target_modules:對特定的模塊進(jìn)行微調(diào),默認(rèn)為None,支持nn.Linear、nn.Embedding和nn.Conv2d;
  • lora_alpha:ΔW 按 α / r 縮放,其中 α 是常數(shù),默認(rèn)為8;
  • task_type:任務(wù)類型,支持包括 CAUSAL_LM、FEATURE_EXTRACTION、QUESTION_ANS、SEQ_2_SEQ_LM、SEQ_CLS 和 TOKEN_CLS 等;
  • lora_dropout:Dropout 概率,默認(rèn)為0,通過在訓(xùn)練過程中以 dropout 概率隨機(jī)選擇要忽略的神經(jīng)元來減少過度擬合的技術(shù);
  • bias:是否添加偏差,默認(rèn)為 "none";

3、訓(xùn)練

使用 peft 庫對SFT全量訓(xùn)練修改如下:

def init_model():
    def count_parameters(model):
        return sum(p.numel() for p in model.parameters() if p.requires_grad)
    
    def find_all_linear_names(model):
        cls = torch.nn.Linear
        lora_module_names = set()
        for name, module in model.named_modules():
            if isinstance(module, cls):
                names = name.split('.')
                lora_module_names.add(names[0] if len(names) == 1 else names[-1])

        return list(lora_module_names)

    model = Transformer(lm_config)
    ckp = f'./out/pretrain_{lm_config.dim}.pth.{batch_size}'
    state_dict = torch.load(ckp, map_locatinotallow=device_type)
    unwanted_prefix = '_orig_mod.'
    for k, v in list(state_dict.items()):
        if k.startswith(unwanted_prefix):
            state_dict[k[len(unwanted_prefix):]] = state_dict.pop(k)
    model.load_state_dict(state_dict, strict=False)

    target_modules = find_all_linear_names(model)
    peft_config = LoraConfig(
        r=8,
        target_modules=target_modules
    )
    model = get_peft_model(model, peft_config)
    model.print_trainable_parameters()

    print(f'LLM總參數(shù)量:{count_parameters(model) / 1e6:.3f} 百萬')
    model = model.to(device_type)
    return model

只需要修改模型初始化部分,其他不變,訓(xùn)練過程和之前一樣,這里不再贅述。

參考

(1)https://cloud.tencent.com/developer/article/2372297

(2)http://www.bimant.com/blog/lora-deep-dive/

(3)https://blog.csdn.net/shebao3333/article/details/134523779

責(zé)任編輯:武曉燕 來源: 周末程序猿
相關(guān)推薦

2024-11-26 09:33:44

2024-11-04 00:24:56

2025-04-03 15:40:41

機(jī)器學(xué)習(xí)大模型DeepSeek

2024-12-09 00:00:10

2025-01-10 08:38:10

2020-08-10 15:05:02

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2025-04-03 15:46:53

2022-03-28 09:00:00

SQL數(shù)據(jù)庫機(jī)器學(xué)習(xí)

2017-03-24 15:58:46

互聯(lián)網(wǎng)

2023-06-24 19:59:40

2017-07-11 10:19:24

淺層模型機(jī)器學(xué)習(xí)優(yōu)化算法

2022-09-06 08:00:00

機(jī)器學(xué)習(xí)金融數(shù)據(jù)科學(xué)

2018-11-07 09:00:00

機(jī)器學(xué)習(xí)模型Amazon Sage

2024-08-20 07:55:03

2017-10-09 12:55:29

機(jī)器學(xué)習(xí)KaggleStacking

2020-10-13 07:00:00

機(jī)器學(xué)習(xí)人工智能

2018-05-16 09:26:41

基線模型機(jī)器學(xué)習(xí)AI

2024-06-21 11:44:17

2017-10-23 15:46:37

2021-04-09 14:49:02

人工智能機(jī)器學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

中文字幕日韩欧美一区二区三区| 蜜臀99久久精品久久久久久软件| 日本韩国精品一区二区在线观看| 日b视频免费观看| 久久不见久久见中文字幕免费 | 欧美日韩色图| 亚洲激情免费观看| 领导边摸边吃奶边做爽在线观看| 久久动漫亚洲| 国产精品入口免费视频一| 伊人网在线播放| 欧美亚洲高清一区二区三区不卡| 亚洲免费一级视频| 国产激情偷乱视频一区二区三区| av资源站久久亚洲| 欧美人与牛zoz0性行为| 久久综合久久美利坚合众国| 最新av在线播放| 在线精品观看国产| 影音先锋可以看的网站| 中文文精品字幕一区二区| 亚洲亚洲精品三区日韩精品在线视频| 三级电影一区| 欧美一级在线亚洲天堂| 巨胸喷奶水www久久久免费动漫| 精品一区二区精品| 久久精品国产第一区二区三区最新章节| 久久av国产紧身裤| 日韩中文字幕网| 欧美13videosex性极品| 欧美精品自拍偷拍| av在线播放av| 91精品办公室少妇高潮对白| 黄色资源在线看| 一区二区三区在线视频播放| www.日本一区| 国产日产欧美一区二区视频| 超碰10000| 国产成人精品综合在线观看| 亚洲国产一区二区精品视频| 国产伦精品一区二区三区视频黑人| 国产精品22p| 欧美激情一区二区三区久久久| 日本在线中文字幕一区二区三区 | 亚洲第一会所| 日韩毛片中文字幕| 牛牛精品一区二区| 亚洲深夜福利在线| 日韩专区视频网站| 久久久久久久一区二区| 精品人人人人| 久久久久久国产精品三级玉女聊斋| 国产91亚洲精品久久久| 精品欧美黑人一区二区三区| 国产精品12345| 99热在线网站| 成人免费看片39| 国产激情999| 清纯唯美亚洲综合一区| 91香蕉嫩草影院入口| 亚洲精品97| 激情视频在线观看一区二区三区| 国产午夜久久| 中国一级黄色录像| av在线这里只有精品| 蜜臀视频一区二区三区| 国产精品素人一区二区| 久久小说免费下载| 在线精品亚洲一区二区不卡| www免费视频观看在线| 国产视频精品自拍| 国产日本亚洲| 国产区亚洲区欧美区| 亚洲精品专区| 国产精品videossex国产高清| 久久色中文字幕| 色资源网站在线观看| 日韩欧美在线观看一区二区三区| 成人日韩精品| 国产999精品久久久影片官网| 97国产成人高清在线观看| 国产精品日韩欧美一区二区| 久久国产生活片100| 北条麻妃视频在线| 在线看国产一区二区| 欲香欲色天天天综合和网| 97国产在线视频| 国产精品jizz在线观看美国| 国产又大又长又粗又黄| 国产丝袜欧美中文另类| 日韩一区二区三区中文字幕| 精品亚洲夜色av98在线观看| 日韩在线你懂的| 日韩精品国内| 亚洲欧洲精品一区二区三区不卡| 无遮挡动作视频在线观看免费入口| 在线观看亚洲视频| 999久久久国产精品| 欧美做受777cos| 亚洲国产综合色| 中国色在线日|韩| 成人黄色免费在线观看| 国产综合久久久久影院| 在线黄色国产电影| 亚洲欧美中文字幕| 无需播放器亚洲| 少妇高潮毛片色欲ava片| 欧美亚洲国产一区二区三区| 日本在线一区二区三区| 日韩欧美一区二区三区四区| 亚洲免费资源在线播放| 中文在线中文资源| 91久久久在线| 91啪亚洲精品| 91麻豆免费在线视频| 国产成人精品午夜| 成人免费毛片片v| melody高清在线观看| 久久免费视频观看| 国产专区欧美精品| 91青青在线视频| 国产精品久久久久av免费| 国产成人免费高清| 日本中文在线观看| 国产精品亚洲欧美导航| 91在线精品秘密一区二区| 污片在线免费观看| 粉嫩av免费一区二区三区| 久久精品这里都是精品| 无码小电影在线观看网站免费| 国产伦精品一区二区三区免| 日韩美女视频19| 欧美一级片网址| av在线com| 日韩精品免费综合视频在线播放| 欧美精品综合| 中文字幕亚洲精品视频| 久久乐国产精品| 99久久精品久久久久久清纯| 两个人看的在线视频www| 久久精品国产一区二区三区不卡| 亚洲精品日韩专区silk| 香蕉大人久久国产成人av| 妞干网在线观看视频| 日韩av在线免费播放| 久久午夜影视| 成人ww免费完整版在线观看| 99影视tv| 在线中文字幕一区| 天天做天天爱综合| 久草热久草在线频| 国产精品网址在线| 亚洲午夜精品一区二区三区他趣| 日韩精品丝袜美腿| 快色在线观看| 国产日产欧美a一级在线| 亚洲美女视频一区| 国产一区二区三区四区大秀| 成视频年人免费看黄网站| 97国产一区二区精品久久呦| 国产欧美精品在线观看| 国产精品白浆| 三级短视频在线| 日产日韩在线亚洲欧美| 一区二区视频在线| 日本精品三区| 激情小视频在线| 久久亚洲一区二区| 日韩视频在线你懂得| 捆绑紧缚一区二区三区视频| 中文字幕高清在线播放| 潘金莲一级淫片aaaaaa播放1| 亚洲电影免费观看| 国产毛片精品国产一区二区三区| 中文字幕一区久| 缅甸午夜性猛交xxxx| 欧美国产高跟鞋裸体秀xxxhd| 国产欧美日韩麻豆91| 欧洲亚洲一区二区三区| 樱桃视频免费看| 国产精品视频免费一区二区三区| 宅男在线国产精品| 国产精品1024久久| 精品三级av在线导航| 久草在线官网| 久久久久国产精品视频| 日韩av在线看| 国产精品久久三| 女人香蕉久久**毛片精品| 在线观看男女av免费网址| 精品人妻大屁股白浆无码| 国内精品一区二区三区四区| 精品成人在线视频| 蜜臂av日日欢夜夜爽一区| 国产一区二区三区亚洲综合| 99视频入口| 欧洲av一区| 欧美激情日韩图片| 欧美视频一区在线| 久久婷婷色综合|