国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Qwen3VL源碼側改進點及DeepStack核心思想概述 原創

發布于 2025-9-25 10:56
瀏覽
0收藏

首先從源碼角度看Qwen3VL的改進,核心圍繞增強多模態融合深度(DeepStack)、優化視覺特征處理、提升時序建模精度(視頻時間戳編碼)以及精細化歸一化設計(文本專用RMSNorm),整體更注重多模態任務中的特征對齊與深層交互。然后概述DeepStack用于多模態大模型的核心思想。

Qwen3VL源碼側改進點

代碼側改動如下:

1.??hidden_act="silu"??? -> ??hidden_act="gelu_pytorch_tanh"??

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

2.Qwen3VLProcessor引入??Qwen3VLVideoProcessor??,更加適配視頻處理

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

3.視覺塊歸一化層調整

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

  • Qwen2.5VL:視覺塊(??Qwen2_5_VLVisionBlock???)使用??Qwen2RMSNorm??作為歸一化層(一種RMSNorm變體)。
  • Qwen3VL:視覺塊(??Qwen3VLVisionBlock???)改用??nn.LayerNorm??(標準層歸一化)。這一調整可能是為了更好地適配視覺特征的分布特性,提升訓練穩定性或特征表達能力。

4.引入DeepStack多模態融合機制

  • Qwen3VL在文本模型(??Qwen3VLTextModel??)中新增了DeepStack機制(DeepStack機制能讓視覺信息更深度地參與文本解碼過程,提升多模態理解的連貫性。),通過??_deepstack_process???方法將視覺特征(??deepstack_visual_embeds??)融入解碼器的多個隱藏層。在解碼器層的前向傳播中,會在指定層將視覺特征疊加到對應位置的文本隱藏狀態上:

# Qwen3VLTextModel.forward
if deepstack_visual_embeds is not None and layer_idx in range(len(deepstack_visual_embeds)):
    hidden_states = self._deepstack_process(
        hidden_states, visual_pos_masks, deepstack_visual_embeds[layer_idx]
    )
  • Qwen2.5VL視覺特征僅在輸入嵌入階段替換占位符 token,未在解碼器深層進行融合。

5.視頻時序位置編碼優化

  • Qwen2.5VL:在??get_rope_index???中,視頻的時序位置編碼基于絕對時間間隔(如??second_per_grid_t * tokens_per_second??),直接計算時序索引。
  • Qwen3VL:修改了視頻時序處理邏輯,通過時間戳(而非絕對時間位置)區分視頻幀,將??video_grid_thw???重復展開并強制時序維度為1(??video_grid_thw[:, 0] = 1??),時序信息通過外部時間戳 token 傳遞:

# Qwen3VLModel.get_rope_index
if video_grid_thw is not None:
    video_grid_thw = torch.repeat_interleave(video_grid_thw, video_grid_thw[:, 0], dim=0)
    video_grid_thw[:, 0] = 1  # 時序維度固定為1,依賴時間戳區分

6.視覺特征分層輸出與融合

  • Qwen3VL:視覺模型(??Qwen3VLVisionModel???)的??get_image_features???和??get_video_features??不僅返回最終視覺嵌入,還返回分層視覺特征(??deepstack_image_embeds/deepstack_video_embeds??),用于DeepStack機制在解碼器多層融合:

# Qwen3VLModel.get_image_features
image_embeds, deepstack_image_embeds = self.visual(pixel_values, grid_thw=image_grid_thw)
  • Qwen2.5VL:僅返回單一視覺嵌入,無分層特征輸出。分層特征融合能讓不同層級的視覺信息(如低級紋理、高級語義)分別參與文本解碼,提升多模態對齊精度。

7.文本RMSNorm的獨立優化

  • Qwen3VL:新增??Qwen3VLTextRMSNorm???類,專門針對文本部分優化??RMSNorm???,明確注釋其與T5LayerNorm等效,并通過??@use_kernel_forward_from_hub("RMSNorm")??引入可能的 kernel 優化:

@use_kernel_forward_from_hub("RMSNorm")
class Qwen3VLTextRMSNorm(nn.Module):
    def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
        input_dtype = hidden_states.dtype
        hidden_states = hidden_states.to(torch.float32)
        variance = hidden_states.pow(2).mean(-1, keepdim=True)
        hidden_states = hidden_states * torch.rsqrt(variance + self.variance_epsilon)
        return self.weight * hidden_states.to(input_dtype)
  • Qwen2.5VL:文本和視覺共享??Qwen2RMSNorm???,未針對文本單獨優化。文本??RMSNorm??的獨立設計可更精細地適配文本特征分布,提升語言建模能力。

DeepStack

大多數多模態模型通過將視覺 token 作為序列輸入到LLM的第一層來實現。這種架構雖然簡單,但顯著增加了計算 和內存成本,因為其輸入層需要處理大量額外的 token。DeepStack考慮到 LMMs 中語言和視覺 Transformer 的 N 層,將視覺 token 堆疊成 N 組,并將每組從下到上依次輸入到其對應的 Transformer 層.

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

  • 如上左圖:傳統的大型多模態模型將所有視覺 token 串接成一個序列,適用 于高分辨率和低分辨率圖像。
  • 中間圖: DeepStack LMMs 將 token 堆疊成網格,并自下而上地將其注入到 Transformer 的前幾層和中間層,僅通過殘差連接實現。
  • 右圖:將 DeepStack 應用于 Vicuna-7B(DeepStack-L)和 CLIP ViT-L(DeepStack-V),模型能夠接受 4× 倍的視覺 token,在相同的上下文長度下顯著超 越序列式 LMM,并在廣泛的基準測試中與使用更長上下文的模型相媲美。

架構

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

主要創新在于 DeepStack 策略(通過將圖像特征抽取分為兩個流來實現這一點:一個全局視圖流用于捕捉全局信息,另一個高分辨率流通過在不同層的大模型中堆疊擴張的高分辨率圖像特征來增強全局信息。),該策略將視覺 token 注入到不同的層中。大白話:DeepStack 的本質是利用 Transformer 的分層架構特性,將視覺 token 的 “整合過程” 分散到 LLM 的多層中。

  • 左圖:用于大模型的 DeepStack :給定輸入圖像,將從低分辨率版本中提取的 token 輸入到大模型的輸入層??紤]到圖像的二維特性,從高分辨率版本中提取相鄰區域,并將其重新組織為DeepStack ,然后將其輸入到大模型的后續層中。
  • 右圖:用于 ViTs 的 DeepStack :采用類似的采樣策略,但將視覺 token 輸入到視覺編碼器的 ViT 層中。DeepStack-V 的適配邏輯:利用 ViTs 的編碼器分層結構,將高分辨率視覺 token 注入 ViTs 的中間層,而非僅在輸入層(PatchEmbed)處理,增強 ViTs 的細粒度特征提取能力。

多模態大模型基于投影的連接模塊獲得了視覺標記,DeepStack策略就是如何在保持多模態處理有效的同時提供信息豐富的視覺標記。

DeepStack PyTorch偽代碼:

Qwen3VL源碼側改進點及DeepStack核心思想概述-AI.x社區

def forward(H0, Xstack, lstart, n, vis_pos):
    H = H0  # LLM初始隱藏態(含全局視覺token+文本token)
    for (idx, TransformerLayer) in enumerate(self.layers):
        # 滿足條件時,注入高分辨率堆疊token(殘差連接)
        if idx >= lstart and (idx - lstart) % n == 0:
            stack_idx = (idx - lstart) // n  # 對應Xstack的索引
            H[vis_pos] += Xstack[stack_idx]  # vis_pos:視覺token在隱藏態中的位置
        # 正常執行LLM的Transformer層計算
        H = TransformerLayer(H)
    return H

參考文獻


本文轉載自??大模型自然語言處理??   作者:余俊輝

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-9-25 10:59:54修改
收藏
回復
舉報
回復
相關推薦
91香蕉视频mp4| www..com久久爱| 亚洲午夜久久久影院| 天天色综合6| 亚洲成色www久久网站| 精品视频在线你懂得| 制服丝袜国产精品| 视频二区在线播放| 日韩影院免费视频| 国产综合在线观看视频| 国产电影一区| 国产亚洲欧美日韩一区二区| 在线视频资源站| 欧美日韩激情视频8区| 天堂一区在线观看| 亚洲国产成人自拍| 日韩精品免费播放| 91视频观看视频| 精品国产一区探花在线观看| 一区二区亚洲欧洲国产日韩| 99福利在线| 精品国产一区二区三区四区四 | 国产电影一区| 一区二区av在线| 成人免费一区| 中文字幕日韩免费视频| 国产精品成人国产| 久久色精品视频| 亚洲视频一起| 国产精品第七十二页| 中文在线观看视频| 色悠久久久久综合欧美99| 欧洲免费在线视频| 精品国偷自产国产一区| 欧美7777| 国产成人综合精品| 性久久久久久| www.com毛片| 婷婷久久综合九色综合绿巨人| 蜜桃视频在线观看网站| 3751色影院一区二区三区| 欧美free嫩15| 欧美精品videossex88| 午夜久久美女| 人妻激情另类乱人伦人妻| 国产精品久久久久久久久快鸭| 色综合888| 最近2019年好看中文字幕视频 | 欧美精品一区视频| 精品欠久久久中文字幕加勒比| 91精品视频在线播放| 日韩欧美国产片| 尹人成人综合网| www.av片| 欧美精品一卡两卡| 久久九九热re6这里有精品| 国产日产亚洲精品| 日韩专区在线视频| 日本调教视频在线观看| 国产婷婷成人久久av免费高清| 日韩免费视频| 日韩av在线中文| 亚洲欧美综合图区| 亚洲黄页一区| 高清日韩av| 久久精品一本久久99精品| 性欧美长视频| 国产精品影院在线| 国产久一一精品| 亚洲色图在线视频| 国产亚洲欧美日韩精品一区二区三区 | 欧美中在线观看| 26uuu国产电影一区二区| 色图在线观看| 麻豆91av| 日韩欧美精品三级| 日韩电影免费在线看| xxx一区二区| 欧美三级午夜理伦三级在线观看| 懂色av一区二区三区四区五区| 欧美色涩在线第一页| 91精品二区| 在线观看国产原创自拍视频| 国产精品一区二区av| 精品视频999| 国产日韩欧美| 国产精品25p| 一二三四视频社区在线| 久久成人精品一区二区三区| 久久精品欧美一区二区三区麻豆| 国产精品一区二区精品| h七七www色午夜日本| 成人v精品蜜桃久久一区| 亚洲欧洲自拍| 99精品免费在线观看| 午夜精品一区二区三区在线| 亚洲成人1区2区| 久久一区精品| 国产精品国产亚洲精品| 国产乱子视频| 日韩精品欧美在线| 国产一区二区三区视频免费| 国产精品国产自产拍高清av| 自拍日韩欧美| 成人影院在线免费观看| 久久国产情侣| 疯狂做受xxxx高潮欧美日本| 黄色免费在线看| 日本福利视频在线| 国产在线视频不卡| 亚洲男人天堂视频| 亚洲免费观看视频| 日韩中文字幕区一区有砖一区| 91午夜精品| 亚洲电影观看| 在线亚洲电影| 草草视频在线免费观看| 91网站免费观看| 九九九久久国产免费| 欧美猛男超大videosgay| 久久精品人人做人人爽97| 久久精品日产第一区二区| 四虎884aa成人精品最新| 性欧美18一19sex性欧美| 国模精品一区二区| 97香蕉久久| 国产a视频免费观看| 三级网在线观看| 欧美日韩精品免费看| 亚洲www永久成人夜色| 91精品国产电影| 久久免费高清视频| 久久久久www| 一本色道久久88精品综合| 亚洲成人久久一区| 欧美人伦禁忌dvd放荡欲情| 午夜精品久久久久久久蜜桃app| 国产精品天美传媒沈樵| 久在线观看视频| 日本一区二区三区精品视频| 精品伦理一区二区三区| 亚洲淫片在线视频| 国产一区自拍视频| 日韩国产美国| 日本a级片在线观看| 国产成人生活片| 免费大片在线观看| 2020中文字幕在线| 久久久久久久久久久久久久久久久久久| 欧美精品成人网| 日本福利视频| 99se视频在线观看| 黄色成人在线网| 四虎精品永久免费| 婷婷综合一区| 亚洲成色精品| 国产美女一区二区三区| 久久色.com| 在线免费不卡电影| 亚洲欧美一区二区三区久久 | 久久青青草原| 国产精品免费看久久久无码| 九一国产精品视频| 一级毛片在线观| 尤物在线视频| 天堂久久午夜av| 高潮按摩久久久久久av免费| 精品这里只有精品| 日本精品久久久| 欧美最大成人综合网| 欧美伦理视频在线观看| 91caoporn在线| 日本99精品| 香蕉亚洲视频| 亚洲免费电影在线| 91官网在线免费观看| 中文字幕av日韩| 99国产超薄丝袜足j在线观看 | 欧洲免费在线视频| 高清不卡一区| 久久激情久久| 欧美日韩国产影院| 久久久成人精品| 欧美成ee人免费视频| 高清日韩av| 巨大黑人极品videos精品| 欧美区一区二| 波多视频一区| 欧美不卡高清| 亚洲黄色免费电影| 欧美大胆a视频| 日本在线视频www色| 色图在线观看| 首页国产欧美日韩丝袜| 亚洲午夜电影在线| 4388成人网| 国产黄色免费电影| 久久99国内| 亚洲一级大片| 精品在线91|