国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌

發(fā)布于 2024-12-23 08:54
瀏覽
0收藏

一、摘要

SigLIP【全稱:Sigmoid Loss for Language Image Pre-Training】,SigLIP是在batch內(nèi),利用sigmod對(duì)文-圖對(duì)做二分類;CLIP是在batch內(nèi),利用softmax對(duì)文-圖對(duì)做多分類。

SigLIP不需要對(duì)兩兩相似進(jìn)行全局歸一化,這樣的做法允許擴(kuò)大batch的大小,同時(shí)在較小的batch下也能表現(xiàn)的好。

如下圖所示:

SigLIP利用sigmod對(duì)文-圖對(duì)做二分類,是在指導(dǎo)模型朝著文字Tokens和圖像Tokens的兩個(gè)序列的對(duì)角線上值越來越大,非對(duì)角線上的值越來越小的方向前進(jìn)。即,希望配對(duì)的文-圖對(duì)越來越匹配,非配對(duì)的文-圖對(duì)越來越不匹配。

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

二、亮點(diǎn)

1. 二分類損失的計(jì)算

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

只需要計(jì)算文-圖矩陣,對(duì)角線的得分就可以了,相比softmax計(jì)算更加簡單,快捷。

2. 高效的分片計(jì)算損失

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

將batch內(nèi)的數(shù)據(jù)分塊到每塊GPU之后,可以單獨(dú)計(jì)算更新每塊GPU上的sigmoid損失,不需要全局歸一化損失,然后所有GPU上的損失相加取平均,就能得到全局的損失,這樣能帶來高效的計(jì)算。

三、多模態(tài)訓(xùn)練的寶貴經(jīng)驗(yàn)

What matters when building vision-language models 是HuggingFace團(tuán)隊(duì)做了大量實(shí)驗(yàn)后,總結(jié)出來的多模態(tài)訓(xùn)練的經(jīng)驗(yàn)。其中就對(duì)比了??CLIP???與??SigLIP??的性能

3.1 SigLIP更有競爭力

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

在LLM相同的情況下,將視覺編碼器從CLIP-ViT-H切換到SigLIP-SO400M在基準(zhǔn)測(cè)試中提升了3.3個(gè)百分點(diǎn)。

3.2 投影層:橋接視覺模型與語言模型

輸入投影目的是將預(yù)訓(xùn)練的視覺模塊和語言模塊連接起來,對(duì)齊視覺輸入和文本輸入,主流方法有兩種:

  • 交叉注意力(Cross-attention):通過視覺模塊對(duì)圖像進(jìn)行編碼,并通過交叉注意力塊將圖像嵌入與文本嵌入注入到語言模型的不同層中。
  • 完全自回歸架構(gòu)(fully autoregressive architecture):視覺編碼器的輸出直接與文本嵌入串聯(lián),并將整個(gè)序列作為語言模型的輸入。視覺序列可以進(jìn)行壓縮,提高計(jì)算效率。

從實(shí)驗(yàn)的結(jié)果來看:

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

  • 在單模態(tài)預(yù)訓(xùn)練模塊被凍結(jié)時(shí),交叉注意結(jié)構(gòu)性能優(yōu)于完全自回歸結(jié)構(gòu)。然而,一旦解凍并訓(xùn)練單模態(tài)網(wǎng)絡(luò),盡管交叉注意結(jié)構(gòu)參數(shù)更多,但完全自回歸架構(gòu)反而展現(xiàn)出更佳的性能。
  • 在完全自回歸架構(gòu)下,直接解凍預(yù)訓(xùn)練模塊可能會(huì)導(dǎo)致訓(xùn)練過程的不穩(wěn)。采用LoRA技術(shù)可以在保持訓(xùn)練穩(wěn)定的同時(shí),有效增加模型的表現(xiàn)力。
  • 由于語言模型規(guī)模遠(yuǎn)遠(yuǎn)大于視覺模型,對(duì)最終結(jié)果輸出影響較大。所以建議采用自回歸模型,放開視覺模型的參數(shù)微調(diào)后,再對(duì)語言模型采用lora微調(diào),來提高模型的性能。

3.3 固定圖像大小和分辨率,提高模型泛化能力

視覺編碼器通常在固定大小的正方形圖像上進(jìn)行訓(xùn)練。調(diào)整圖像大小會(huì)改變其原始寬高比,這在某些任務(wù)(如閱讀長文本)存在問題。因此,在訓(xùn)練時(shí),最好要固定圖像的原始寬高比。

僅在單一分辨率上進(jìn)行訓(xùn)練存在局限性:低分辨率可能忽略關(guān)鍵視覺細(xì)節(jié),而高分辨率則降低訓(xùn)練和推理效率。因此,要允許不同分辨率的圖像被納入到模型中訓(xùn)練

測(cè)試結(jié)果如下:

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

在使用SigLIP作為視覺編碼器的情況下,采用固定長寬比的策略(AR preserving),使用預(yù)訓(xùn)練的視覺編碼器來保持圖像的原始寬高比和分辨率,既加速了訓(xùn)練和推理,又減少了內(nèi)存消耗,且性能不受影響。

3.4 一個(gè)圖片切成多個(gè)子圖,提高DocVQA任務(wù)的性能

將圖像分割成子圖,然后再與原始圖像連接可以提高下游任務(wù)的性能,但代價(jià)是需要編碼的圖像tokens數(shù)量大幅度增加。

在訓(xùn)練期間將圖像分割成子圖像,可以在推理期間提高計(jì)算效率,提高性能。在涉及讀取圖像中的文本的任務(wù)中,性能的提高尤其明顯。

測(cè)試結(jié)果如下:

多模態(tài)視覺層:CLIP、SigLIP誰更勝一籌-AI.x社區(qū)

在指令微調(diào)階段,將每張圖像擴(kuò)展為包含原始圖像和四個(gè)裁剪圖像的列表。這樣,模型在推理時(shí)既能處理單張圖像(64個(gè)視覺tokens),也能處理增強(qiáng)的圖像集(總共320個(gè)視覺tokens)

3.5 訓(xùn)練多模態(tài)的技巧

1. 數(shù)據(jù)準(zhǔn)備

  • 交叉的圖像-文本文檔:選用OBELICS數(shù)據(jù)集,包含3.5億張圖像和1150億個(gè)文本tokens。OBELICS的長文檔設(shè)計(jì)使語言模型在維持性能的同時(shí),能夠?qū)W習(xí)處理任意數(shù)量的交叉圖像和文本。
  • 圖像-文本對(duì):LAION COCO中的圖像由基于COCO訓(xùn)練的模型進(jìn)行標(biāo)注,噪聲較少。并使用一個(gè)高召回率的NSFW分類器進(jìn)行過濾。
  • PDF文檔:為了克服VLM在提取圖像和文檔中文本時(shí)的不足,使用OCR-IDL的1900萬份行業(yè)文檔、PDFA6的1800萬頁數(shù)據(jù),并加入了Rendered Text來增強(qiáng)對(duì)字體多樣、顏色豐富文本的識(shí)別。

2.預(yù)訓(xùn)練

  • 第一階段,圖像最大分辨率設(shè)為384像素,使得可以使用平均大小為2048的批次大小
  • 第二階段,引入PDF文檔,將分辨率提升至980像素,保持全局批次大小但減少單機(jī)批次大小,使用梯度累積彌補(bǔ)額外內(nèi)存。

3. 指令微調(diào)

  • 多任務(wù)指令集:如視覺問答、計(jì)數(shù)、字幕、文本轉(zhuǎn)錄、文檔理解等。數(shù)據(jù)集采用共享的問題/答案格式,對(duì)于多問題/答案對(duì),構(gòu)建多回合對(duì)話。
  • lora微調(diào):使用一種LoRA變體DoRA對(duì)基礎(chǔ)模型進(jìn)行指令調(diào)優(yōu)。

??https://arxiv.org/pdf/2303.15343??

??https://github.com/google-research/big_vision/tree/main??

本文轉(zhuǎn)載自 ??CourseAI??,作者: CourseAI

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产精品免费在线播放| 欧美性20hd另类| 成人影院在线| 亚洲制服欧美中文字幕中文字幕| 亚洲午夜国产成人av电影男同| 国产在线精品一区二区夜色| 国产av不卡一区二区| 成人午夜在线免费| 亚洲一区二区三区四区在线| a级影片在线观看| 国产啪精品视频| 国产精品欧美一区二区三区| 亚洲毛片视频| 污污的网站在线看| www成人免费| 久操成人在线视频| 久久久久久97三级| 久久99国产精品视频| 在线观看国产视频一二三| 欧美精品在线播放| 久久久精品黄色| 亚洲午夜精品| 黄色av免费| 国产精品一区久久久| 国产精品国产三级国产三级人妇| 国产成人精品免费在线| 国产成人福利夜色影视| 99热一区二区三区| 久久青草精品视频免费观看| 夜夜揉揉日日人人青青一国产精品| 奇米亚洲欧美| 9999热视频在线观看| 久久综合久久网| 国产美女99p| 亚洲午夜精品久久久久久久久久久久 | 欧美日韩成人一区二区| 国产亚洲午夜高清国产拍精品| 四虎国产精品免费观看| 精品久久国产一区| 怡红院在线播放| 成人黄色激情网站| 欧美日韩午夜精品| www成人在线观看| 精精国产xxxx视频在线野外| 成人免费影院| 国产精品久久久久白浆| 穿情趣内衣被c到高潮视频| 欧美日本在线播放| 91网址在线看| 日本成在线观看| 99青草视频在线播放视| 亚洲成av人片一区二区梦乃| 国产区亚洲区欧美区| 久久精品免费看| 国产精品xxx在线观看| 国模私拍视频在线播放| 精品电影在线| 国产免费av高清在线| bt电影在线| 8x8x华人在线| 精品一卡二卡三卡四卡日本乱码| 午夜精品久久久久久99热软件 | 中文字幕成人| 日韩一区二区三区免费| 99久久伊人| 成人在线免费看| 激情五月婷婷久久| 亚洲春色综合另类校园电影| 欧美黄色三级网站| 在线日韩中文字幕| 亚洲毛片在线观看| 欧美福利一区二区| 51午夜精品国产| 欧美探花视频资源| 欧美精三区欧美精三区| 日本道在线观看一区二区| 激情五月婷婷综合网| 日韩三级在线| 亚洲深夜福利在线| 久久久另类综合| 一本久道久久综合狠狠爱| 日本不卡二三区| 九九视频免费观看视频精品| 亚洲婷婷丁香| 99精品国产高清一区二区麻豆| 成人在线观看网站| 日本视频一二区| 在线观看一级片| 免费在线黄色电影| 成人免费看视频网站| 欧美成人福利在线观看| 中文字幕在线亚洲三区| 成人在线观看视频网站| 日韩在线免费av| 最新国产精品拍自在线播放| 欧美精品xxxxbbbb| 白白色亚洲国产精品| 国产一区二区在线看| 成人精品视频一区| 欧美综合一区二区三区| 欧美激情精品久久久久久变态 | 久久综合网色—综合色88| 国产精品一区一区三区| 亚洲中无吗在线| 国产视频一区二区在线观看| 粉嫩av一区二区三区| 欧美激情中文不卡| 欧美日韩国产123区| 色婷婷**av毛片一区| 国产在线视频91| 牛人盗摄一区二区三区视频| 成人性色生活片| 欧美一区二区三区男人的天堂| 亚洲欧美中文日韩在线| 欧美不卡在线视频| 国产精品黄色| 成人黄色大片在线观看 | 亚洲春色h网| 日韩电影免费在线| 自拍偷拍亚洲综合| 88在线观看91蜜桃国自产| 久久99精品国产| 日韩免费高清av| 日韩精品在线免费| 国产亚洲激情在线| 444亚洲人体| 欧美激情精品久久久久久小说| 免费观看成年在线视频网站| 婷婷av在线| 亚洲天堂久久| 亚洲特级片在线| 久久久久久中文字幕| 久久这里只有精品8| 国产污视频在线| 日本超碰一区二区| 不卡一区二区三区四区| 欧美综合一区二区| 欧美日韩成人综合| 日韩一中文字幕| 成人国产在线看| 免费黄色在线| 色8久久久久| 日本欧美国产| 中文字幕在线播放不卡一区| 亚洲男人天堂2024| 日韩少妇中文字幕| 韩国日本一区| 丝袜美腿高跟呻吟高潮一区| 欧美亚一区二区| 91传媒视频在线观看| 另类图片激情| 成人av婷婷| 亚洲天堂免费看| 色爱精品视频一区| www.夜夜爱| 日韩电影av| 亚洲色图欧美激情| 久久频这里精品99香蕉| 偷偷要 色偷偷| 国内精品视频| 国产视频一区在线观看 | 极品视频在线| 日日摸夜夜添夜夜添亚洲女人| 久久最新资源网| 天天综合视频在线观看| 久久毛片高清国产| 久久99热这里只有精品国产| 精品一区二区三区视频日产| 伊人久久大香线蕉综合网蜜芽| 欧美日韩亚洲一区二区三区| 精品国产乱码久久久久久丨区2区| 麻豆传媒视频在线观看免费| 美女看a上一区| 亚洲综合成人在线| 国产精品v欧美精品v日韩| 国精一区二区三区| 国产69精品久久久久毛片| 国内精品久久久久久中文字幕| 亚洲 国产 日韩 综合一区| 韩国三级大全久久网站| 久久久五月婷婷| 国产一区二区不卡视频| 美女福利一区| 不卡的av网站| 久久精品一区二区三区不卡免费视频| 亚洲综合网站| 欧美日韩免费高清一区色橹橹| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 国产精品成人一区二区三区吃奶 | 999精品网| 国产剧情在线观看一区二区| 国产日韩欧美夫妻视频在线观看| av在线free| 国产精品亲子伦av一区二区三区| 欧美日韩视频在线观看一区二区三区| 国产一级爱c视频| 亚洲精品a级片| 久久久这里只有精品视频| 青青草视频在线免费播放 | 亚洲国产精品精华液2区45|