国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

次元突破!OccSora:深刻演化自動(dòng)駕駛4D Occ世界(北航&清華)

人工智能 智能汽車
今天為大家分享北航&UC Berkeley&清華最新的工作—OccSora,文章提出了一個(gè)基于擴(kuò)散的4D占用生成模型OccSora來模擬自動(dòng)駕駛世界模型的進(jìn)展。

本文經(jīng)自動(dòng)駕駛之心公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

寫在前面&筆者的個(gè)人理解

文章提出了一個(gè)基于擴(kuò)散的4D占用生成模型OccSora來模擬自動(dòng)駕駛世界模型的進(jìn)展。該模型使用一個(gè)四維場(chǎng)景標(biāo)記器來獲得四維占用輸入的時(shí)空表示,并實(shí)現(xiàn)長(zhǎng)序列占用視頻的高質(zhì)量重建。然后,學(xué)習(xí)時(shí)空表征的擴(kuò)散轉(zhuǎn)換器,并根據(jù)軌跡提示生成4D占用。OccSora可以生成具有真實(shí)3D布局和時(shí)間一致性的16秒視頻,展示其對(duì)駕駛場(chǎng)景時(shí)空分布的理解能力。

開源鏈接:https://wzzheng.net/OccSora/

主要貢獻(xiàn)

傳統(tǒng)的自動(dòng)駕駛模型依靠車輛自身的運(yùn)動(dòng)來模擬場(chǎng)景的發(fā)展,所以無法像人類那樣對(duì)場(chǎng)景感知和車輛運(yùn)動(dòng)有深刻的理解;世界模型的出現(xiàn)能夠更深層次地理解自動(dòng)駕駛場(chǎng)景和車輛運(yùn)動(dòng)之間的綜合關(guān)系。然而現(xiàn)階段的大多數(shù)方法采用自回歸框架來模擬3D場(chǎng)景,這阻礙了該模型有效地生成長(zhǎng)期視頻序列的能力。

所以如圖1所示,相較于先前的方法,該模型基于2D視頻生成模型Sora,提出了一個(gè)4D世界模型OccSora。其設(shè)計(jì)了一種基于擴(kuò)散的世界模型來實(shí)現(xiàn)遵循物理規(guī)律的可控場(chǎng)景生成。具體來說,采用多維擴(kuò)散技術(shù)傳遞準(zhǔn)確時(shí)空四維信息,并以真實(shí)汽車軌跡為條件實(shí)現(xiàn)軌跡可控的場(chǎng)景生成,從而更深入地理解自動(dòng)駕駛場(chǎng)景與車輛運(yùn)動(dòng)之間的關(guān)系。OccSora通過訓(xùn)練和測(cè)試,可以生成符合物理邏輯的自動(dòng)駕駛4D占用場(chǎng)景,實(shí)現(xiàn)基于不同軌跡的可控場(chǎng)景生成。提出的自動(dòng)駕駛4D世界模型為理解自動(dòng)駕駛和物理世界中的動(dòng)態(tài)場(chǎng)景變化開辟了新的可能性。

圖1 現(xiàn)有方法的比較

具體方法

1、自動(dòng)駕駛系統(tǒng)的世界模型

4D占用可以全方位的捕捉三維場(chǎng)景的結(jié)構(gòu)、語義和時(shí)間信息,有效促進(jìn)弱監(jiān)督或自監(jiān)督學(xué)習(xí),可應(yīng)用于視覺、激光雷達(dá)或多模態(tài)任務(wù)。基于此,該論文把世界模型X表示為4D占用R。圖2展示了OccSora的總體框架。

圖2  OccSora模型總體框架

2、4D占用場(chǎng)景標(biāo)記器

圖3 4D占用場(chǎng)景標(biāo)記器的結(jié)構(gòu)

(1)類別嵌入和標(biāo)記器

(2)3D視頻編碼器

(3)碼本和訓(xùn)練目標(biāo)

(4)3D視頻解碼器

3、基于擴(kuò)散的世界模型

圖4 基于擴(kuò)散的世界模型的框架

(1)token嵌入

(2)軌跡調(diào)節(jié)嵌入

(3)擴(kuò)散transformer

4、實(shí)驗(yàn)

OccSora作為自動(dòng)駕駛領(lǐng)域的4D占用世界模型,可以在不需要任何3D邊界框、地圖或歷史信息輸入的情況下,更深入地理解自動(dòng)駕駛場(chǎng)景與車輛軌跡之間的關(guān)系。它可以構(gòu)建一個(gè)遵循物理定律的長(zhǎng)時(shí)間序列世界模型。

(1)實(shí)現(xiàn)細(xì)節(jié)

(2)4D占用重建

壓縮和重建四維占用是學(xué)習(xí)圖像生成所需的潛在時(shí)空相關(guān)性和特征的必要條件。與傳統(tǒng)的視頻和圖像處理模型不同,OccSora的操作比單幀占用率高一個(gè)維度,比圖像高兩個(gè)維度。因此,實(shí)現(xiàn)有效的壓縮和準(zhǔn)確的重建是至關(guān)重要的。圖5描繪了4D占用的真實(shí)情況和重建情況。

圖片圖5 4D占用場(chǎng)景標(biāo)記器重建的可視化

此外還對(duì)4D占用重建進(jìn)行了定量分析,如表1所示。從表中可以看出,即使OccSora實(shí)現(xiàn)了比OccWorld高32倍的壓縮比,它仍然保持了原始OccWorld模型近50%的mIoU。這種統(tǒng)一的時(shí)間壓縮有效地捕獲了各種元素的動(dòng)態(tài)變化,與漸進(jìn)式自回歸方法相比,提高了長(zhǎng)序列建模能力。

表1 4D占用重建的定量分析圖片

(3)4D占用生成

在四維占用生成任務(wù)的基于擴(kuò)散的世界模型中,使用OccSora模型生成的token,經(jīng)過32幀的訓(xùn)練,作為生成實(shí)驗(yàn)的輸入。在圖6中展示了從10,000到1,200,000步的跨訓(xùn)練迭代的可視化結(jié)果。這些視覺結(jié)果表明,隨著訓(xùn)練迭代次數(shù)的增加,OccSora模型的精度不斷提高,顯示出連貫場(chǎng)景的生成。

圖片圖6 精確場(chǎng)景的逐步生成可視化

同樣的將提出的OccSora模型與其他代模型進(jìn)行了比較和定量評(píng)估。作為第一個(gè)用于自動(dòng)駕駛的4D占用世界模型,僅將其與傳統(tǒng)的圖像生成、2D視頻生成和靜態(tài)3D占用場(chǎng)景生成方法進(jìn)行了比較。如表2所示,OccSora模型在起始距離(FID)方面取得了不錯(cuò)的性能,證明了所提出方法的有效性。

表2OccSora與其他模型在生成能力上的比較圖片

軌跡視頻生成。OccSora能夠根據(jù)不同的輸入軌跡生成各種動(dòng)態(tài)場(chǎng)景,從而學(xué)習(xí)自動(dòng)駕駛中自我車輛軌跡與場(chǎng)景演化之間的關(guān)系。如圖7所示,將不同的車輛軌跡運(yùn)動(dòng)模式輸入到模型中,展示了直行、右轉(zhuǎn)和靜止的4D占用情況。此外進(jìn)行了不同尺度的軌跡生成實(shí)驗(yàn),結(jié)果表明,靜止場(chǎng)景的FID得分最低,而彎曲場(chǎng)景的FID得分較高,這表明連續(xù)建模彎曲運(yùn)動(dòng)場(chǎng)景的復(fù)雜性和建模靜止場(chǎng)景的簡(jiǎn)單性。

圖片圖7 不同輸入軌跡下的4D占用生成

場(chǎng)景視頻生成。在合理的軌跡控制下,場(chǎng)景的多樣性至關(guān)重要。為了驗(yàn)證在可控軌跡下生成場(chǎng)景的泛化性能,OccSora模型對(duì)三種軌跡下不同場(chǎng)景的4D占用場(chǎng)景重建進(jìn)行了測(cè)試。在圖8中,左右兩部分分別展示了在同一軌跡下產(chǎn)生不同場(chǎng)景的能力。在重建的場(chǎng)景中,周圍的樹木和道路環(huán)境表現(xiàn)出隨機(jī)變化,但仍然保持了原始軌跡的邏輯,顯示了在生成與原始軌跡對(duì)應(yīng)的場(chǎng)景及其在不同場(chǎng)景中的泛化方面保持魯棒性的能力。

圖片圖8 在軌跡控制下生成多種連續(xù)場(chǎng)景

(4)消融實(shí)驗(yàn)

標(biāo)記器與嵌入分析。對(duì)提出的組件進(jìn)行了消融實(shí)驗(yàn),包括不同的壓縮尺度、類標(biāo)記器離散化的數(shù)量、時(shí)間步嵌入和車輛軌跡嵌入,如表3所示。當(dāng)類標(biāo)記器離散化的數(shù)量從8個(gè)減少到4個(gè)時(shí),重構(gòu)精度下降了大約18%。

表3 不同組件之間的消融實(shí)驗(yàn)結(jié)果圖片

在去除時(shí)間步長(zhǎng)嵌入組件后,F(xiàn)ID得分也有所下降。在沒有位置嵌入的情況下,生成的場(chǎng)景缺乏運(yùn)動(dòng)控制,并且受數(shù)據(jù)分布的影響幾乎呈線性運(yùn)動(dòng)模式。此外,在較低的壓縮比下,盡管重建性能優(yōu)于較高的壓縮比,但缺乏高維特征相關(guān)性會(huì)阻礙有效場(chǎng)景的生成。

生成步驟分析。去噪的總步數(shù)和去噪率會(huì)在一定程度上影響生成質(zhì)量。如圖9所示,隨著去噪率的提高,生成的場(chǎng)景逐漸清晰。從表4的定量結(jié)果可以看出,增加去噪步驟總數(shù)可以在一定程度上提高生成精度。然而,token大小和信道數(shù)量對(duì)生成質(zhì)量的影響要比對(duì)去噪步驟總數(shù)的影響大得多。

表4 不同尺度對(duì)去噪步驟和去噪率的定量分析。圖片圖片圖9 不同軌跡或去噪步驟下去噪比的影響

5、結(jié)論與限制

在本文中,介紹了一個(gè)生成4D占用的框架,以模擬自動(dòng)駕駛中的3D世界發(fā)展。使用4D場(chǎng)景標(biāo)記器,獲得了輸入的密集表示,并實(shí)現(xiàn)了長(zhǎng)序列占用視頻的高質(zhì)量重建。然后,學(xué)習(xí)時(shí)空表征的擴(kuò)散轉(zhuǎn)換器,并在軌跡提示的條件下生成4D占用。通過在nuScenes數(shù)據(jù)集上的實(shí)驗(yàn),證明了場(chǎng)景進(jìn)化的準(zhǔn)確性。未來,將研究更精細(xì)的4D占用世界模型,探索閉環(huán)設(shè)置下端到端自動(dòng)駕駛的可能性。

局限性。4D占用世界模型的優(yōu)勢(shì)在于建立了對(duì)場(chǎng)景和運(yùn)動(dòng)之間關(guān)系的理解。然而,由于體素?cái)?shù)據(jù)粒度的限制,無法構(gòu)建更精細(xì)的4D場(chǎng)景。生成結(jié)果還顯示運(yùn)動(dòng)對(duì)象的細(xì)節(jié)不一致,可能是由于訓(xùn)練數(shù)據(jù)的小尺寸。

責(zé)任編輯:張燕妮 來源: 自動(dòng)駕駛之心
相關(guān)推薦

2022-06-25 21:26:45

自動(dòng)駕駛技術(shù)

2024-12-26 09:17:27

2024-10-28 13:30:00

2025-02-26 10:17:43

2024-12-19 10:20:53

2024-12-16 14:40:00

AI模型訓(xùn)練

2022-01-18 10:51:09

自動(dòng)駕駛數(shù)據(jù)人工智能

2020-09-16 13:51:24

百度百度世界2020無人駕駛

2024-03-11 10:08:12

駕駛模型

2022-10-27 10:18:25

自動(dòng)駕駛

2024-12-25 09:50:00

2024-12-04 10:00:00

自動(dòng)駕駛3D檢測(cè)

2024-08-15 09:50:44

2022-03-21 18:21:34

自動(dòng)駕駛卡車智能

2021-11-18 09:50:35

自動(dòng)駕駛輔助駕駛人工智能

2022-07-12 09:42:10

自動(dòng)駕駛技術(shù)

2023-01-04 10:02:53

強(qiáng)化學(xué)習(xí)自動(dòng)駕駛

2018-10-24 14:16:33

自動(dòng)駕駛道路測(cè)試牌照
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲久久视频| 欧美日韩一卡二卡| 色偷偷免费视频| 欧美日韩综合一区| 日韩精品中文字| 国产免费视频在线| 久久久精品亚洲| 午夜一级久久| 啦啦啦中文高清在线视频 | 欧美一区二区三区成人| 视频精品一区| 亚洲欧洲一区二区福利| 亚洲国产精品久久人人爱蜜臀| 亚洲电影观看| 成人久久久久久久| 久久理论电影网| 色网站在线看| 国产精品高精视频免费| 99久久久精品免费观看国产蜜| www污污在线| 久久精品亚洲94久久精品| 国产精品久久777777毛茸茸| 理论片在线观看理伦片| 麻豆乱码国产一区二区三区 | 久久精品免视看国产成人| 亚洲精品在线免费| 欧美日韩免费在线观看| 午夜日韩影院| 99精品一级欧美片免费播放| 这里只有精品电影| 永久91嫩草亚洲精品人人| 在线日韩第一页| 黄色av日韩| 999一区二区三区| 成人免费视频97| 国产真实乱偷精品视频免| 欧美综合在线观看| 国产成都精品91一区二区三| gogo在线观看| 成人羞羞视频免费| 一区二区在线观看av| 欧美第一在线视频| 欧美一级免费播放| 亚洲国产日韩精品在线| 亚洲激情网址| 91黄视频在线| 日本一区二区高清| 欧美黄色免费影院| 在线观看欧美成人| 精品在线欧美视频| 亚洲v日本v欧美v久久精品| 国产成人精品在线| 99久久婷婷国产| 亚洲电影有码| 已婚少妇美妙人妻系列| 欧美日韩第一视频| 舔着乳尖日韩一区| 中文视频一区| 久久爱www.| 欧美日韩免费观看视频| 中文字幕久久久av一区| 日韩成人一级片| 精品视频一区二区| 97人人干人人| 亚洲欧美在线x视频| 影音先锋在线播放| 精品免费国产| 精品美女被调教视频大全网站| 日本不卡一区二区三区| 欧美巨大丰满猛性社交| 国产精品免费看久久久无码| 最近中文字幕2019免费| 国产亚洲自拍一区| 性欧美xxxx免费岛国不卡电影| 福利h视频在线| 岛国一区二区三区高清视频| 91.成人天堂一区| 久久国产夜色精品鲁鲁99| 国产精品麻豆一区二区| 一区二区三区在线| 国产乱码午夜在线视频| 亚洲精品一区二区三区蜜桃久| 亚洲福利在线观看| 亚洲精品日本| 一本一道波多野毛片中文在线| 2021狠狠干| 4438亚洲最大| 日韩中文字幕亚洲一区二区va在线 | 欧美精品一区二区三区免费播放| 2023国产一二三区日本精品2022| 91九色成人| 濑亚美莉vs黑人在线观看| 玉足女爽爽91| 911久久香蕉国产线看观看| 不卡在线视频| 一区二区三区av| 欧美成人一区二区三区电影| 夜色激情一区二区| 夜久久久久久| 欧美国产日韩电影| 国产主播在线资源| 国产三区精品| 综合国产在线视频| 亚洲国产精品麻豆| 欧美96一区二区免费视频| 久久9999免费视频| 国产高清一级毛片在线不卡| 国产高清不卡无码视频| 98视频在线噜噜噜国产| 欧美影院一区二区| av在线一区二区三区| 日韩视频在线观看| 牛牛精品一区二区| 国内在线高清免费视频| 色一情一区二区三区四区| 欧美激情一级二级| 欧美日韩国产美| 久久精品亚洲精品国产欧美kt∨ | 日韩欧美在线影院| 91色视频在线| 亚洲欧洲综合| 91丨精品丨国产| a√在线中文网新版址在线| 日本一道本久久| 国产精品av一区| 欧美成人在线免费视频| 欧美久久久久久久久久| 欧美国产成人在线| 天堂一区二区在线| 精品久久精品| 欧美黄色网页| 欧美日韩影视| 97成人在线免费视频| 91探花福利精品国产自产在线 | 日本电影在线观看| av一级在线| 亚洲乱码国产乱码精品天美传媒| 日本中文字幕久久看| 亚洲色图偷窥自拍| 日本韩国欧美一区| 国产目拍亚洲精品99久久精品| 欧美亚洲三级| 日韩精品二区| 清纯唯美激情亚洲| 国产精品一二三产区| 一级二级在线观看| 欧美 日韩 国产在线观看| 黄色99视频| 国产美女久久精品| 欧美国产视频一区二区| 亚洲福利在线视频| 精品视频123区在线观看| 亚洲欧美日韩国产一区二区三区| 国产综合色在线视频区| 香蕉久久国产| 伊人成综合网| 欧洲福利电影| 国产另类在线| 深夜福利亚洲| 在线高清av| 在线中文字幕电影| 国产色a在线| 亚洲国产精华液| 国产一级黄色电影| 欧美性猛交久久久乱大交小说| 宅男一区二区三区| 国产在线精品一区| 96国产粉嫩美女| 国产精品久久久久久久美男| 国语自产精品视频在免费| www.亚洲人.com| 亚洲性生活视频| 亚洲精品不卡在线| 日韩免费视频一区| 777色狠狠一区二区三区| 色一情一伦一子一伦一区| 亚洲综合色自拍一区| 亚洲天堂a在线| 亚洲欧洲国产日韩| 国产精品久久久久久一区二区三区 | 蜜桃视频在线观看播放| 在线观看三级视频| 免费的黄网站在线观看| 99免在线观看免费视频高清| 人人九九精品| 亚洲电影小说图| 日本午夜在线| 久久伊伊香蕉| av网页在线| 国产一二三区在线观看| 超碰在线无需免费| 2021天堂中文幕一二区在线观| 暧暧视频在线免费观看| 瑟瑟视频在线看| 成人天堂yy6080亚洲高清 | 91精品国产综合久久久久久蜜臀| 欧洲一区二区视频| 国产伦精品免费视频| 亚洲一区国产精品| 国产在线精品二区|