国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Qwen原生多模態(tài)開源,淺析一下!

發(fā)布于 2025-3-28 00:45
瀏覽
0收藏

Qwen2.5-Omni 7B開源,Qwen的第一個端到端的多模態(tài)模型,可以文本、圖像、音頻和視頻輸入,同時以流式方式生成文本和自然語音回復(fù)。

提出了 Thinker-Talker 架構(gòu)。

Qwen原生多模態(tài)開源,淺析一下!-AI.x社區(qū)

PR還沒合進去,要注意安裝方式

Qwen原生多模態(tài)開源,淺析一下!-AI.x社區(qū)

評測的榜似乎畫的有點趕,看不出信息量。

Qwen原生多模態(tài)開源,淺析一下!-AI.x社區(qū)

提出了一種新的位置嵌入,稱為 TMRoPE(時間對齊多模態(tài) RoPE),用于同步視頻輸入的時戳與音頻。

資源占用:理論值如下,實際要在高1.2倍,看起來消耗有點大。


瞄下代碼,關(guān)于輸入,每個模態(tài)都有專門的處理組件:

class Qwen2_5OmniProcessor(ProcessorMixin):
    attributes = ["omni_processor", "feature_extractor", "tokenizer"]
    omni_processor_class = "Qwen2VLImageProcessor"
    feature_extractor_class = "WhisperFeatureExtractor"
    tokenizer_class = ("Qwen2Tokenizer", "Qwen2TokenizerFast")

視頻這里,還計算每個視頻時間網(wǎng)格對應(yīng)的實際秒數(shù),用于TMRoPE中的時間對齊

if videos is not None:
    videos_inputs = self.omni_processor(images=None, videos=videos, **output_kwargs["videos_kwargs"])
    if fps is None:
        fps = [2.0] * len(videos)
    videos_inputs["video_second_per_grid"] = [
        fps[i] / self.omni_processor.temporal_patch_size for i in range(len(fps))
    ]

模型代碼的核心由3塊構(gòu)成,Thinker,Talker,Token2Wav

talker是將文本轉(zhuǎn)成語音編碼,Token2Wav是將編碼轉(zhuǎn)成波形。

里邊實現(xiàn)了幾個Token2Wav變體:

  • Qwen2_5OmniToken2WavDiTModel:基于擴散模型的波形生成
  • Qwen2_5OmniToken2WavBigVGANModel:基于GAN的波形生成
  • Qwen2_5OmniToken2WavModel:通用基類

文本輸出和語音輸出是兩條并行的路徑:

  • 文本輸出:輸入 → Thinker → 文本輸出
  • 語音輸出:輸入 → Thinker → Talker → Token2Wav → 語音輸出

只有當(dāng)需要語音輸出時,才會激活Talker模塊和Token2Wav模塊,將Thinker生成的文本內(nèi)容轉(zhuǎn)換為語音。

細節(jié)可以自行看源碼,不貼了。


在看看新的位置編碼。

對于純文本,使用常規(guī)的1D位置編碼。

對于包含視覺(圖像/視頻)和文本的混合輸入,函數(shù)分別計算:

  • 視覺部分用3D位置編碼
  • 文本部分用1D位置編碼

比如說,一個有3個時間片、2×2空間分辨率的視頻示例:

輸入序列: [V V V V V V V V V V V V T T T T T]
視覺時間位置ID: [0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2]
視覺高度位置ID: [0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1]
視覺寬度位置ID: [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
文本位置ID從視覺最大位置ID+1開始: [3, 4, 5, 6, 7]

將時間維度映射到位置ID,考慮每秒對應(yīng)多少個位置單位(position_id_per_seconds)

t_index = (torch.arange(grid_t) * second_per_grids[video_idx] * position_id_per_seconds).long()
llm_pos_ids = self.get_llm_pos_ids_for_vision(
    start_idx, video_idx, spatial_merge_size, t_index, grid_hs, grid_ws
)

針對視頻中包含音頻的情況,還單獨處理了,視頻和音頻交替編碼,按時間塊組織,每個時間塊包含視頻幀和對應(yīng)的音頻段,音頻有特殊的開始和結(jié)束標記(audio_start_token_id和audio_end_token_id)

# 視頻和音頻混合處理
t_index_split_chunk = self.split_list_into_ranges(t_index, t_ntoken_per_chunk)

for t_chunk in t_index_split_chunk:
    vision_ntoken_per_chunk = len(t_chunk) * grid_h * grid_w // (spatial_merge_size**2)
    new_src_item.extend([video_token_id] * vision_ntoken_per_chunk)
    # 為視頻區(qū)塊分配位置ID
    
    new_src_item.extend(min(t_ntoken_per_chunk, pure_audio_len - added_audio_len) * [audio_token_id])
    # 為音頻區(qū)塊分配位置ID

最后開源地址:https://huggingface.co/Qwen/Qwen2.5-Omni-7B

代碼地址:https://github.com/huggingface/transformers/blob/3a1ead0aabed473eafe527915eea8c197d424356/src/transformers/models/qwen2_5_omni/modeling_qwen2_5_omni.py#L1175

本文轉(zhuǎn)載自??NLP前沿??,作者:NLP前沿


收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
免费看的黄色大片| 在线视频不卡一区二区三区| 成人看片免费| 99久久精品免费看国产| 91免费版网站入口| 国产亚洲亚洲国产一二区| 在线不卡中文字幕| www.国产91| 成人午夜在线免费| 日韩av在线一区二区三区| 精品免费视频| 欧美另类极品videosbestfree| 免费在线中文字幕| 欧美性色黄大片手机版| 免费激情网址| 国产精品久久久久永久免费观看 | 7777精品伊人久久久大香线蕉的| 一道本视频在线观看| 国模大尺度一区二区三区| 亚洲专区在线视频| 精品久久精品| 日本高清不卡的在线| 777久久精品| 欧美日韩第一页| 欧美91在线|欧美| 亚洲视频在线观看网站| 草草在线视频| 亚洲电影免费观看| 美女av在线免费看| 亚洲欧洲第一视频| 日本在线中文字幕一区二区三区| 国产视频在线一区二区| 成人观看网址| 亚洲美女激情视频| gogo亚洲高清大胆美女人体| 亚洲乱码国产乱码精品精天堂| bbw在线视频| 国产亚洲精品日韩| 成人在线免费av| 日韩亚洲综合在线| 亚洲三级在线| 欧美男插女视频| 免费看一区二区三区| 精品国内亚洲在观看18黄| 国产欧美88| 国精产品一区一区三区有限在线| 久久动漫网址| 成人精品久久av网站| 欧美视频久久| 日本成人三级电影网站| 蜜桃视频一区二区| 国精产品一区一区三区视频| 久久精品男人天堂av| 国产精美视频| 在线观看免费成人| 国产乱妇乱子在线播视频播放网站| 欧美精品一区二区久久久| 欧美成人ⅴideosxxxxx| 欧美高清无遮挡| 色无极亚洲影院| 久久精品二区| 国产精品资源在线观看| 国产a级片免费观看| 亚洲一区电影777| 日本高清中文字幕在线| 精品香蕉一区二区三区| 1313精品午夜理伦电影| 91在线观看欧美日韩| 日韩**一区毛片| 成年人观看网站| 亚洲五月六月丁香激情| 国产色在线观看| www亚洲精品| 欧美性感美女一区二区| 欧美日韩一区二区视频在线| 懂色av一区二区三区免费观看| 成人免费观看www在线| 色婷婷av一区二区三区之一色屋| 色综合999| 欧美黄色片在线观看| 欧美日韩爆操| 缅甸午夜性猛交xxxx| 婷婷综合五月天| 免费日韩电影| 清纯唯美亚洲激情| 日韩高清一级片| av手机在线看| 日韩欧美国产综合| 日韩三级不卡| av资源一区二区| av不卡免费在线观看| 色综合888| 久久综合电影一区| 99综合精品| 国产91色在线观看| 日韩一区二区视频在线观看| 中文字幕一区二区三区四区久久| 国产欧美一区二区视频| 久久精品日产第一区二区三区高清版| 爱久久·www| 久久免费观看视频| 奇米777欧美一区二区| 色网视频在线| 深夜福利国产精品| 欧美日韩国产精品一区二区亚洲| 久在线观看视频| 欧美视频一区二区三区| 91在线一区| 在线观看免费91| 欧美三级欧美成人高清www| 成人性教育av免费网址| 久久综合久久88| 免费成人在线网站| 男操女在线观看| 高清视频欧美一级| 久久99国产乱子伦精品免费| 视频国产在线观看| 久久久久久高潮国产精品视| 久久国产夜色精品鲁鲁99| 亚洲高清福利| 97香蕉超级碰碰久久免费软件| 国产一区二区三区免费观看| 在线免费黄色| 成人精品视频久久久久| 国产精品免费视频观看| 亚洲国产尤物| 日本一区二区三区视频免费看| 黄色91在线观看| 日韩高清电影免费| 久草综合在线观看| 中文字幕亚洲激情| 久久9热精品视频| 国产剧情在线观看| 国产精品欧美一区二区三区奶水| 久久久久国产精品人| av有声小说一区二区三区| 欧美精品一区三区在线观看| 日本二三区不卡| 99久久www免费| 精品一二三四| 久久久久久久久久久免费 | 亚洲国产电影| 美女的诞生在线观看高清免费完整版中文 | 国产精品666| 欧美激情乱人伦| 91麻豆视频网站| 国产精品诱惑| 青青青在线观看视频| 亚洲高清色综合| 日本成人在线不卡视频| 2019中文字幕在线视频| 成人精品一二区| 91国产精品成人| 亚洲视频日本| 美女羞羞视频在线观看| 国产一区二区精品免费| 欧美日韩午夜精品| 欧美亚洲免费| 99久久精品免费观看国产| 免费亚洲一区二区| 欧美一二三区在线观看| 久久狠狠亚洲综合| free欧美| 欧美性大战久久久久xxx| 欧美国产一区二区三区| 成人免费在线视频| 91日韩免费| 精精国产xxxx视频在线| 午夜精品一区二区三区四区| 亚洲精选中文字幕| 国产一区二区视频在线| 久久精品1区| 久久久久久国产精品三级玉女聊斋| 色综合天天爱| shkd中文字幕久久在线观看| 韩日精品中文字幕| 亚洲人成小说网站色在线| 成人av二区| 成全电影播放在线观看国语| 久久精品中文字幕一区二区三区| 日韩三级电影网址| 国产一区二区视频在线| 日韩一区网站| 在线人体午夜视频| 国产伦精品一区二区三区免费视频| 欧美一区二区视频在线观看 | 国产欧美综合在线观看第十页| 波多野结衣一区二区三区免费视频| 91淫黄看大片| 成人免费黄色网| 日韩一区二区三区在线| 高清在线观看日韩| 婷婷五月色综合香五月| 国产精品秘入口| 中文字幕超清在线免费观看| 美乳少妇欧美精品| 婷婷综合另类小说色区| 久久99国产精品久久99| 亚洲最大在线| 激情成人四房播|