鄧紫棋「跨越紅海」幕后,竟是英偉達AIGC黑科技!
這幾天,由ChatGPT引發(fā)的搜索引擎大戰(zhàn),谷歌和微軟是打得火星四濺。
我們即使隔岸觀火,也能深切感受到:這股AIGC的熱潮,恐怕會永遠(yuǎn)改變?nèi)祟惿鐣倪\作方式。
昨天,以「生成式AI大爆發(fā)」為主題的新智者Talk第二期正式上線。
新智者Talk由新智元創(chuàng)始人楊靜女士主持,本期嘉賓是英偉達中國區(qū)Omniverse負(fù)責(zé)人何展。
生成式AI大爆發(fā)
在主持人和嘉賓相繼陽康之后,新智者Talk新一期節(jié)目終于開錄了。這一期的主題是「生成式AI大爆發(fā)」。

其實,就在節(jié)目籌備期間,生成式AI已經(jīng)經(jīng)歷了幾代的迭代和進化,可以說,它進化的速度比節(jié)目籌備的速度還要快。
2022年,就在我們?nèi)祟惥韥砭砣サ臅r候,AI也在悄悄進化,因此,2022年成為了生成式AI的大爆發(fā)年。
有兩件事,可以充分證明生成式AI的火爆。
比如國內(nèi)知名搖滾樂隊——萬能青年旅社的作品《殺死那個石家莊人》,忽然在B站火出了圈。原因竟然是,它的每一句歌詞都被AI配上了畫面。
另一件事,應(yīng)該是很多人耳熟能詳?shù)牧恕C绹囊粋€游戲設(shè)計師,他用AI畫了一幅畫,然后用這幅畫去參加了藝術(shù)類比賽,竟然得到第一名。這也是有史以來,AI首次在藝術(shù)方面打敗人類。

同樣,英偉達Omniverse的強勢迭代也體現(xiàn)了這一點。現(xiàn)在,用戶可以很方便的用數(shù)字化來實現(xiàn)數(shù)字孿生和虛擬數(shù)字人的制作,這為元宇宙的構(gòu)建夯實了基礎(chǔ)。
鄧紫棋「跨越紅海」,英偉達虛擬舞臺加持
楊靜女士提出一個十分有趣的說法:過去這半年時間里,人類在卷來卷去,而AI其實也被卷到了舞臺上。
比如2023年江蘇衛(wèi)視的跨年演唱會,在鄧紫棋演唱《啟示錄》中的《Gloria》時,身邊突然出現(xiàn)萬丈波濤的海浪,就是由AIGC的技術(shù)和AR技術(shù)來生成的。

這個視覺呈現(xiàn),是讓我們中國的億萬觀眾都能親眼看到的,來自元宇宙的震撼。
而這個舞臺背后,就有英偉達的一些黑科技作為支撐。何展就做了現(xiàn)場解密。
比如,這個海水特效,就是內(nèi)容生成重要的應(yīng)用方向。這個舞臺利用了XR技術(shù),還結(jié)合了最新的AIGC生成的技術(shù),為我們呈現(xiàn)出一場華麗的視覺盛宴。這些技術(shù)背后,還包括圖形學(xué)的進步。
第二個黑科技,就是英偉達在AI深度學(xué)習(xí)加速算法上的一些優(yōu)化。舞臺上看,就是大規(guī)模訓(xùn)練模型來去迭代成型的效果。
比如說海水,就需要大量的模擬,需要更多的模型訓(xùn)練數(shù)據(jù)集。最終在舞臺上呈現(xiàn)出來后,就能讓觀眾在欣賞到美妙歌聲的同時,還能身臨其境。
AIGC的三個節(jié)點
基于以上這些背景,楊靜女士向何展提問道:在這樣快速、強勢的迭代背后,在這一輪生成式AI的浪潮當(dāng)中,人工智能生成內(nèi)容(AIGC)背后是什么算法支撐的?它對算法和算力有什么要求,讓年輕人能借此沖浪耍酷呢?
何展從好幾個角度,對此做了精彩的解答。
首先,AIGC和生成式AI的概念,離我們并不遙遠(yuǎn)。有幾個歷史節(jié)點,可以讓我們更好地把握AIGC發(fā)展的脈絡(luò)。
早在1957年,就有了第一首由人工智能創(chuàng)作的弦樂四重奏——《伊利亞克組曲》,這就是最早的人工智能音樂。
當(dāng)時間推到2007年,紐約大學(xué)出版了一本由人工智能創(chuàng)作的小說。雖然里面有各種邏輯錯誤和各種模糊的情節(jié)劇情,但是它是第一個完全由AI完成的小說。
下一個時間點是2014年,在這一年,GAN(生成式對抗網(wǎng)絡(luò))出現(xiàn)了。
這三個時間點,恰好正是生成式AI或者AIGC不同的迭代階段。
這其中有一個非常有意思的事,不知讀者發(fā)現(xiàn)沒有——
在AI發(fā)展的第一個階段,也就是第一首AI生成樂曲《伊利亞克組曲》的誕生,到第一本AI創(chuàng)作的小說,經(jīng)歷了50年時間;但是從第一本AI生成的小說到出現(xiàn)GAN網(wǎng)絡(luò),只過去了7年時間。
而在近幾年,尤其是這半年時間,生成式AI更是如雨后春筍般涌現(xiàn)。有文本成圖片的DALL-E2、Midjourney、Stable Diffusion等等。這些模型都是一兩周的時間在迭代,速度非常快。
深度學(xué)習(xí)技術(shù)的快速迭代,包括剛才提到2014年GAN的生成,大幅加速了生成式AIGC技術(shù)的發(fā)展。
年輕人該如何利用AIGC的技術(shù)呢?在何展看來,未來令人遐想無限。我們都可以看到,現(xiàn)在已經(jīng)有越來越多的工作,都涵蓋了創(chuàng)意性的內(nèi)容。
包括剛才說到的AI寫文章,作音樂,后期制作等,這些方方面面的應(yīng)用,都可能給年輕人提供非常大的空間去開拓和發(fā)掘。
如果年輕人擁抱這些變化,持續(xù)地迭代自己的能力,在未來將會擁有潛力無限。

數(shù)萬億美金藍(lán)海
2022年是元宇宙爆發(fā)的一年,但還沒等元宇宙捂熱呢,AIGC這個新概念又以迅雷不及之勢走紅網(wǎng)絡(luò)。
紅杉資本的合伙人甚至還跟GPT-3合寫了一篇文章,預(yù)測AIGC將會形成一個數(shù)萬億美金的新賽道。
楊靜女士提問道:為什么2022年AIGC會乘上東風(fēng)爆發(fā)?背后的技術(shù)邏輯和產(chǎn)業(yè)邏輯是什么?而元宇宙和AIGC又到底有什么異同呢?
何展對此解釋道,提起GPT-3,就必須提到它背后的參數(shù)——1750億個。
GPT-3剛發(fā)布時,很多研究人員和開發(fā)者都驚呆了。而就在一周前,有一篇關(guān)于GPT-4預(yù)熱的報道,提到GPT-4的參數(shù)能達到100萬億。

對于邁入百萬億參數(shù)級別的模型,未來由它創(chuàng)作出的內(nèi)容會是什么樣子?這值得所有人期待。
而GPT-3、GPT-4之于元宇宙,承擔(dān)的就是一個內(nèi)容生產(chǎn)的角色。
想讓元宇宙應(yīng)用快速地迭代發(fā)展,就必須讓盡可能多的人參與進來。
舉個例子,如果想讓每個人都參與Omniverse平臺,就必須把技術(shù)門檻降低,讓人人都能用它創(chuàng)作出更多的作品。

這時,就需要能快速生成的工具,要又快又好,還要成本低廉。
那么生產(chǎn)力是從何而來呢?就是從生成式AIGC的工具。
現(xiàn)在,包括英偉達在內(nèi),很多公司都在做會議系統(tǒng)。視頻會議中有Maxine算法,如果你開著會想去喝水,算法就可以在你去喝水時,把你的人臉矯正成一張你的新臉,讓別人以為你一直在緊盯著屏幕。

嗯?等等,這不是摸魚嗎?
沒錯,其實,這就是摸魚。
在幾周前,英偉達還曾做過一個有趣的用戶交流。
有用戶說,自己想要這樣一個直播間,它是一個書房,書中要有一些相框或者藝術(shù)品,相框中有藍(lán)天、白云等等。
其實,這類要求并不像演播舞臺那樣苛刻,如今是完全可以實現(xiàn)的。
比如書房的壁紙,想要什么樣的風(fēng)格和色調(diào),都可以用工具輸入,就會產(chǎn)生實時的效果。

如今這些技術(shù)的進步,算是完全把個人的創(chuàng)造欲給激發(fā)出來了。
想象一下,以前你需要畫一幅油畫,現(xiàn)在直接可以讓AI去快速生成,這真的太夢幻了。
2023:AIGC元年
楊靜女士表示,這種設(shè)想真的讓人非常興奮,因為現(xiàn)在微博和微信上的視頻號背后,都有著上千萬甚至上億的用戶。如果能用AI來生成特效或視頻,無疑會激發(fā)很多人的創(chuàng)作欲。
那么,這個愿望能在2023年實現(xiàn)嗎?
何展引用了一個知名調(diào)研機構(gòu)的報告,根據(jù)這個報告,目前生成式AI在整個人工智能生成的比例連1%都不到。因此,如果能在2025年達到10%,已經(jīng)是很驚艷的成績了。
而在生物科學(xué)醫(yī)療領(lǐng)域,到2050年,藥物和材料由AI生成的占比可能會達到30%。
那么,在林林總總的生成式AI技術(shù)當(dāng)中,哪些能夠成為殺手锏呢?AIGC什么時候能真正走向大眾,成為超級APP,又有哪些企業(yè)會贏得黃金的機會呢?
何展認(rèn)為,最關(guān)鍵的地方在于,辨別這些應(yīng)用到底需要哪些殺手級應(yīng)用。
舉個例子,你需要設(shè)計一個電熱水壺,但又想偷懶摸魚,怎么辦?
現(xiàn)在,其實有不少大廠的3D模型生成工具,都可以實現(xiàn)這種設(shè)計的定制。
比如谷歌的DreamFusion和英偉達的Magic 3D,只需輸入一段文字就可以生成你想要的效果。
概括來說就是,只要能夠滿足設(shè)計師或工程師的需求,AIGC隨時都能爆發(fā)。
爽劇一鍵生成
顯然,生成式AI跟內(nèi)容的融合更加緊密,在電商、傳媒、影視等行業(yè),都可以用AI去助力視頻的劇本創(chuàng)作、游戲場景的生成、數(shù)字人輔助帶貨、XR商品展示等。
現(xiàn)在,幾句話就能生成一個劇本,甚至一個短視頻、小電影。而如果未來AIGC大規(guī)模落地,會給產(chǎn)業(yè)鏈的哪一環(huán)節(jié)帶來最大的影響呢?
何展回答說,最近視頻號上非常流行的爽劇,就是用爽文拍成的。但這個過程中的生產(chǎn)力,其實是缺乏的。
要知道,爽劇背后的制作人員,在中國大概有10萬人,這10萬人在整個制作鏈條的最末端,他們的作品倒了很多手,才真正成為舞臺上或熒幕上的作品。
這些制作人員非常辛苦,卻沒有得到太多收益。但是,如果爽劇能夠通過AIGC快速生產(chǎn),就會帶動一批人進來。技術(shù)門檻降下來,生產(chǎn)力就起來了,自然會有一個閉環(huán)。
并且,不止的編劇,在藥物研發(fā)、教育等領(lǐng)域,都會有這樣一個制作、投放、產(chǎn)生經(jīng)濟效益的閉環(huán)。
不過,楊靜女士提出一個非常關(guān)鍵的問題:既然爽文和爽劇能夠一鍵生成,會不會讓年輕人太過依賴這樣的工具,從而喪失想象力呢?
何展表示,可以肯定,AI工具并不會讓人喪失想象力。
比如,英偉達去年在杭州做了一個設(shè)計周的活動,現(xiàn)場就展示了一個叫「神筆馬良」的工藝——Nvidia Canvas。在左側(cè)勾勒出曲線,右側(cè)就可以通過你的輸入,讓AI腦補一個畫面。
簡單畫幾筆,右邊就會生成真實照片一樣的作品。
讓何展非常感動的是,在場的許多小朋友比大人要認(rèn)真得多,非常的聚精會神。而很多大人是開玩笑或是羞澀的態(tài)度。
因而他們畫出的畫,比成人參展的畫作都要有想象力。
同樣一個AI工具,產(chǎn)生的作品卻截然不同。這就告訴我們:輸入的想象力不同,作品達到的效果是完全不一樣的。因此即使是科技迭代出來的工具,依然離不開人類的想象力和專注。
因此,生成式AI可以激發(fā)年輕人的想象力,讓思維不再被束縛,讓想象力插上翅膀。不論未來出現(xiàn)的工具多令人驚艷,最終的input還是取決于我們自己。
國內(nèi)玩家群雄逐鹿
講到這里,就不得不提到,谷歌、微軟、Meta等大廠最近的群雄逐鹿。而OpenAI這樣的新晉獨角獸,也在最近憑ChatGPT掙足眼球,獲得微軟的100多億美元投資。
同時,國內(nèi)的BAT等大廠,也都在AIGC領(lǐng)域搶跑。
哪些玩家會成為領(lǐng)跑者呢?2023年技術(shù)發(fā)展的最大看點又在哪里呢?
何展認(rèn)為,國內(nèi)的互聯(lián)網(wǎng)大廠,一定會有類似于ChatGPT的模型出來。
比如阿里的在線購物,騰訊的社交等等,可遐想的應(yīng)用就非常多,而大廠也一定會重金投入的。
行星級算力,能生成動態(tài)「生命冊」
在節(jié)目尾聲,楊靜女士講起自己最近做的一個神奇的夢。在夢里,同學(xué)送給她一本相冊,把她一生中記憶最深刻的畫面用數(shù)字和圖像活靈活現(xiàn)地呈現(xiàn)出來,仿佛一本活生生的生命冊。
由此,楊靜有了一個奇妙的想法:能不能利用AIGC技術(shù),把一個人一年、一生的影像自動生成一個虛擬相冊?如果我們想回顧自己的微博或朋友圈,一天一天地找這些記憶是很難的,而如果用AI回溯這些畫面,自動生成一個生命冊,就會容易得多。
何展表示,問題不大,就像手機有時會推送給我們一個moment,也是同樣的邏輯。
我們可以把自己過去這些年的資料作為input,然后輸入生成。而你可以要求溫情一點,或者歡快一點,生成的相集也會有相應(yīng)的情緒表達。

楊靜女士談起自己曾經(jīng)養(yǎng)過一只叫小豆豆的小狗,它在2020年去世了。她曾看過一個廣告,把狗的照片input給那個產(chǎn)品,它就會生成一個寵物狗一生的相冊。但特意找狗的相片會很麻煩,所以如果AI能從圖庫里自動尋找,肯定會滿足不少人的需求。
何展聽完很感動,他也認(rèn)為,隨著工具進展得越來越快,會越來越多地進入普通人的生活,肯定會有新的行當(dāng)出現(xiàn),比如有些人會利用這些工具做成新的APP。
楊靜表示,我們的伙伴、寵物、親人,都是我們生命中的軟肋,也是最溫情的部分,這是人性最大的資產(chǎn)。
而未來的元宇宙除了有爽文和爽劇,還會出現(xiàn)規(guī)模龐大的虛擬城市,還有很多個性相異的虛擬明星,甚至并不是人類。
這些虛擬和真實明星的數(shù)字分身又可以生成新的數(shù)字相冊和虛擬電影,也就有了無數(shù)的生命冊,未來AIGC有能力生成一個新的數(shù)字行星、數(shù)字地球,甚至是包羅萬象的數(shù)字元宇宙嗎?
何展認(rèn)為,一切皆有可能,暢想一下,所有這些技術(shù),最終推動的還是生產(chǎn)力,而現(xiàn)在,大家的需求已經(jīng)存在了,比如生成一個相冊,讓人回顧那些溫情的時刻。而用戶需要的是又快又好又便宜,比如十幾塊錢就能生成一個相冊。
在節(jié)目最后,楊靜女士總結(jié)道:黃仁勛掛在嘴邊的口頭禪就是「saving money」,所以又快又好又強的一個生成式AI,必定能夠顛覆人類的未來。
所以,在2023年,感謝生成式AI帶我們跨越了紅海,也帶我們?nèi)セ仡櫸覀內(nèi)松?dāng)中溫馨的記憶,所以我們更加憧憬2023年生成式AI大爆發(fā)會帶來一個斑斕多彩的世界,以及一個充滿無限可能的、有行星級算力的元宇宙、新宇宙。































