国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LLM合集:港大利用GPT-4o生成QA對,打造大規(guī)模多模態(tài)視頻思維鏈(COT)數(shù)據(jù)集

發(fā)布于 2024-12-10 10:30
瀏覽
0收藏

1. VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

LLM合集:港大利用GPT-4o生成QA對,打造大規(guī)模多模態(tài)視頻思維鏈(COT)數(shù)據(jù)集-AI.x社區(qū)

大型視覺語言模型(LVLMs)的進(jìn)步顯著提升了多模態(tài)理解能力,但在視頻推理任務(wù)中仍面臨挑戰(zhàn),主要原因是高質(zhì)量、大規(guī)模數(shù)據(jù)集的缺乏。現(xiàn)有的視頻問答(VideoQA)數(shù)據(jù)集往往依賴于成本高昂且粒度不足的手動標(biāo)注,或者使用會產(chǎn)生冗余幀分析的自動構(gòu)建方法,這限制了它們在復(fù)雜推理任務(wù)中的可擴(kuò)展性和有效性。為了解決這些挑戰(zhàn),我們提出了VideoEspresso,這是一個(gè)新的數(shù)據(jù)集,它包含保留了關(guān)鍵空間細(xì)節(jié)和時(shí)間連貫性的VideoQA對,以及中間推理步驟的多模態(tài)標(biāo)注。我們的構(gòu)建流程采用了一種語義感知的方法來減少冗余,并通過GPT-4o生成QA對。此外,我們開發(fā)了視頻思維鏈(CoT)標(biāo)注以豐富推理過程,指導(dǎo)GPT-4o從QA對和視頻內(nèi)容中提取邏輯關(guān)系。

為了充分利用高質(zhì)量的VideoQA對,我們提出了一種混合LVLM協(xié)作框架,該框架包括一個(gè)幀選擇器和一個(gè)兩階段指令微調(diào)推理LVLM。此框架能夠自適應(yīng)地選擇核心幀,并利用多模態(tài)證據(jù)進(jìn)行CoT推理。在我們提出的基準(zhǔn)測試中,與9種流行的LVLM相比,在14項(xiàng)任務(wù)上,我們的方法在大多數(shù)任務(wù)上優(yōu)于現(xiàn)有基線,展示了卓越的視頻推理能力。

論文: https://arxiv.org/pdf/2411.14794

2. EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality

LLM合集:港大利用GPT-4o生成QA對,打造大規(guī)模多模態(tài)視頻思維鏈(COT)數(shù)據(jù)集-AI.x社區(qū)

在資源受限環(huán)境中部署神經(jīng)網(wǎng)絡(luò)時(shí),先前的工作構(gòu)建了輕量級架構(gòu),分別使用卷積和注意力機(jī)制來捕捉局部和全局依賴關(guān)系。最近,狀態(tài)空間模型(SSM)作為一種有效的全局token交互方式出現(xiàn),其在token數(shù)量上的計(jì)算成本呈線性增長,具有明顯優(yōu)勢。然而,基于SSM構(gòu)建的高效視覺骨干網(wǎng)絡(luò)研究較少。在本文中,我們提出了一種名為Efficient Vision Mamba (EfficientViM)的新架構(gòu),該架構(gòu)基于隱藏狀態(tài)混合器的狀態(tài)空間二元性(HSM-SSD),能夠以更低的計(jì)算成本高效地捕捉全局依賴關(guān)系。在HSM-SSD層中,我們重新設(shè)計(jì)了之前的SSD層,使得可以在隱藏狀態(tài)內(nèi)執(zhí)行通道混合操作。此外,我們提出了多階段隱藏狀態(tài)融合方法,進(jìn)一步增強(qiáng)隱藏狀態(tài)的表示能力,并提供了一種緩解由內(nèi)存限制操作引起瓶頸的設(shè)計(jì)。

結(jié)果表明,EfficientViM系列在ImageNet-1k上達(dá)到了新的速度-精度平衡,相比第二優(yōu)秀的模型SHViT,性能提高了0.7%,同時(shí)運(yùn)行速度更快。另外,在圖像縮放或采用蒸餾訓(xùn)練時(shí),與之前的工作相比,我們在吞吐量和準(zhǔn)確率方面都觀察到了顯著提升。

論文: https://arxiv.org/pdf/2411.15241

3. SALOVA: Segment-Augmented Long Video Assistant for Targeted Retrieval and Routing in Long-Form Video Analysis

LLM合集:港大利用GPT-4o生成QA對,打造大規(guī)模多模態(tài)視頻思維鏈(COT)數(shù)據(jù)集-AI.x社區(qū)

盡管大型多模態(tài)模型取得了進(jìn)展,但在處理長且未經(jīng)剪輯的視頻內(nèi)容時(shí)仍面臨挑戰(zhàn),主要原因是上下文長度的限制和巨大的內(nèi)存開銷。這些限制往往導(dǎo)致信息丟失嚴(yán)重,并降低了模型響應(yīng)的相關(guān)性。隨著網(wǎng)絡(luò)平臺上視頻數(shù)據(jù)的指數(shù)級增長,理解長視頻對于推進(jìn)通用智能至關(guān)重要。在本文中,我們介紹了SALOVA(段增強(qiáng)長視頻助手):一種新穎的視頻-大語言模型框架,旨在通過有針對性的檢索過程增強(qiáng)對長視頻內(nèi)容的理解。

為實(shí)現(xiàn)這一目標(biāo),我們解決了兩個(gè)主要挑戰(zhàn):

我們發(fā)布了SceneWalk數(shù)據(jù)集,這是一個(gè)高質(zhì)量的87,800個(gè)長視頻集合,每個(gè)視頻都在片段級別進(jìn)行了密集標(biāo)注,以使模型能夠捕捉場景連續(xù)性并保持豐富的描述性上下文。

我們的框架通過允許精確識別和檢索與查詢相關(guān)的視頻片段,從而緩解了當(dāng)前視頻-大語言模型的局限性,提高了生成響應(yīng)的上下文相關(guān)性。通過廣泛的實(shí)驗(yàn),SALOVA展示了在處理復(fù)雜長視頻方面的增強(qiáng)能力,顯著提升了在長時(shí)間序列中保持上下文完整性的能力。

論文: https://arxiv.org/pdf/2411.16173

4. Edit Away and My Face Will not Stay: Personal Biometric Defense against\n Malicious Generative Editing

LLM合集:港大利用GPT-4o生成QA對,打造大規(guī)模多模態(tài)視頻思維鏈(COT)數(shù)據(jù)集-AI.x社區(qū)

擴(kuò)散模型的最新進(jìn)展使得生成式圖像編輯變得更加容易,這雖然促進(jìn)了創(chuàng)意編輯,但也引發(fā)了倫理問題,尤其是在涉及惡意修改人像時(shí),這些修改可能威脅到個(gè)人隱私和身份安全。現(xiàn)有的保護(hù)方法主要依賴于對抗性擾動來抵消編輯效果,但往往難以應(yīng)對多樣化的編輯請求。我們提出了一種名為FaceLock的新方法,通過優(yōu)化對抗性擾動來破壞或顯著改變生物特征信息,使編輯后的輸出在生物特征上無法識別。FaceLock將面部識別和視覺感知集成到擾動優(yōu)化過程中,以提供對各種編輯嘗試的強(qiáng)健保護(hù)。

我們還指出了常用評估指標(biāo)中的缺陷,并揭示了它們?nèi)绾伪徊倏v,強(qiáng)調(diào)了需要可靠的保護(hù)評估方法。實(shí)驗(yàn)表明,F(xiàn)aceLock在抵御惡意編輯方面優(yōu)于基線方法,并且對凈化技術(shù)具有魯棒性。消融研究證實(shí)了其穩(wěn)定性和在基于擴(kuò)散的編輯算法中的廣泛適用性。我們的工作推進(jìn)了生物特征防御,并為圖像編輯中的隱私保護(hù)實(shí)踐奠定了基礎(chǔ)。

論文: https://arxiv.org/pdf/2411.16832

本文轉(zhuǎn)載自 ??AI-PaperDaily??,作者: AI-PaperDaily


標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久人人爽人人爽爽久久| 91久久一区二区| 久久久久国产精品www| 在线看片你懂的| 91精品婷婷色在线观看| 日韩av在线精品| 青青草免费在线| 蜜桃传媒视频麻豆第一区免费观看| 欧美aaa在线| 日本福利片免费看| 精品伊人久久97| 欧美3p视频| 久久国产成人精品国产成人亚洲 | 成人午夜国产| 国内外成人激情免费视频| 精品国产乱码久久久久久天美 | 114国产精品久久免费观看| 美女在线视频免费| 国产精品毛片无遮挡高清| 好吊色欧美一区二区三区四区| 天堂av在线网| 亚洲第一精品在线| 德国一级在线视频| 国产精品综合在线视频| 青青色在线视频| 欧美猛交免费看| 免费观看在线综合| 久艹在线视频| 久久亚洲精品成人| 蜜桃在线一区二区三区| 日韩a在线观看| 97免费中文视频在线观看| 国内精品免费**视频| 可以在线观看的av网站| 国产91色在线播放| 久久久久国产精品免费免费搜索| heyzo高清国产精品| 国产区欧美区日韩区| 亚洲午夜三级在线| 欧美一性一交| 欧美在线观看视频网站| 精品国产制服丝袜高跟| 午夜电影亚洲| 日本特黄a级高清免费大片| 波霸ol色综合久久| 蜜乳av一区二区三区| a视频在线观看| 极品尤物一区二区三区| 日本韩国欧美一区| 亚洲国产精品久久久久蝴蝶传媒| 黄色av观看| 69视频在线播放| 国产精品嫩草99a| 亚洲人在线视频| 51精品国产| 欧美黄色小视频| 精品三级av在线导航| 国产精品久久久久久久小唯西川| 国产精品一区三区在线观看| 亚洲第一天堂| 高清国产在线一区| 午夜精品成人在线| av一区二区高清| 麻豆福利视频| 国产福利视频一区| 亚洲精品乱码久久久久久黑人| 亚洲91网站| 自拍偷拍一区二区三区四区| 久久影视电视剧免费网站清宫辞电视| 成人av在线影院| 国产精品传媒麻豆hd| 尤物av无码色av无码| 欧美xxxx14xxxxx性爽| 久久精品视频免费观看| 黄色欧美在线| 欧美高清xxxxxkkkkk| 国产精品自在线| 色播五月激情综合网| 欧美在线影院| 免费观看在线黄色网| 久久久久久九九九九| 欧美三级电影网| 午夜一区不卡| 中文字幕在线直播| av在线观看地址| 欧美高清videos高潮hd| 国产精品久久久久aaaa| 精品国产乱码| 91电影在线播放| 日韩亚洲视频在线| 中文字幕精品www乱入免费视频| 91毛片在线观看| 亚洲性视频大全| 国产精品二线| julia京香一区二区三区| 精品国产一区二区三区av性色| 天堂日韩电影| 人妻无码久久一区二区三区免费| 欧美人与物videos| 青青草国产精品97视觉盛宴| 另类专区亚洲| 超碰超碰在线观看| 91久久精品国产| 日韩午夜精品电影| 不卡区在线中文字幕| 日本成人7777| 搞黄视频免费在线观看| 夜夜爽www精品| 久久资源免费视频| 亚洲第一福利一区| 日韩激情中文字幕| 免费视频成人| 一不卡在线视频| 在线看成人av电影| 555www成人网| 亚洲成人a**站| 国产精品久久久久婷婷二区次| 综合激情视频| 国产日韩另类视频一区| 国产一级黄色电影| 色播亚洲婷婷| 欧美亚洲成人xxx| 欧美一区二区日韩| 久久久精品2019中文字幕之3| 欧美激情自拍| 开心久久婷婷综合中文字幕| 一级在线观看| 国产精品12345| av蓝导航精品导航| 在线性视频日韩欧美| 欧美特级www| 91免费观看国产| 国产日韩高清一区二区三区在线| 亚洲一区 二区| 波多野结衣在线播放| 91美女在线| 黄色av网址在线播放| 好吊色欧美一区二区三区视频| 欧美激情一区二区三区在线视频观看 | 91麻豆精品国产91| 国产精品美女免费视频| 韩国中文字幕av| 欧美电影h版| 日本午夜精品视频在线观看| 在线观看网站黄不卡| 性欧美xxxx交| 久久久久久久国产| 欧美日韩小视频| 丁香啪啪综合成人亚洲小说| 成人av在线观| 成人免费福利片| 九九视频精品免费| 欧美国产一区二区三区激情无套| 成人四虎影院| 1区2区3区在线观看| 日韩欧美精品久久| 午夜日韩在线观看| 成人免费毛片片v| 99视频精品免费观看| 香蕉久久夜色精品国产更新时间| 乡村艳史在线观看| 午夜老司机在线观看| 国语对白在线视频| 黄色国产一级视频| 亚洲国产精品视频一区| 99国产超薄丝袜足j在线观看| 欧美性受xxxx白人性爽| 亚洲美女www午夜| 制服丝袜日韩国产| 婷婷一区二区三区| 亚洲三级在线免费观看| 久久久久久久综合日本| 国产suv精品一区二区6| 奇米色一区二区| 国产欧美二区| 国产综合视频| 亚洲一区 二区 三区| 精品久久视频| 欧美91在线| 高清一区二区三区| 精品一区二区三区在线观看视频 | 欧美在线免费播放| 亚洲午夜一区二区| 18涩涩午夜精品.www| 91亚洲精品久久久蜜桃| 国产高清精品网站| 国内精品免费在线观看| 免费在线看一区| 日韩成人精品在线| 久热国产精品| 免费看的黄色欧美网站| 99re国产精品| 欧美日韩伊人| 亚洲午夜一级| 99热这里只有精品8| 一区二区三区高清视频在线观看| 亚洲电影成人| 久久久久欧美精品| 六月丁香综合在线视频| 国内精品免费**视频|