緊急應(yīng)對Sora 2,谷歌推出Veo 3.1版本:一手實(shí)測
剛剛,谷歌Veo 3進(jìn)行了更新,最新版本Veo 3.1,可以在這里體驗(yàn)
https://labs.google/fx/zh/tools/flow
目前免費(fèi)用戶每月提供100積分,fast模式每次生成耗費(fèi)20積分,相比sora 2 看起來貴很多,sora 2到目前為止都是無限制生成,完全免費(fèi)
我第一時(shí)間就做了一個(gè)Veo 3.1和sora 2的初步對比測試,測試下來,Veo 3.1審美以及提示詞遵循能力還是不如sora 2,不過好處是,Veo 3.1支持上傳人像進(jìn)行創(chuàng)作,sora 2 目前圖生視頻不支持人像
廢話不多說,看玩法:
上手測試
1.圖生視頻:nanobanana + Veo 3.1
先用nanobanana生成一個(gè)超高清小姐姐

提示詞:
{
"scene": "mirror_selfie_otaku_pc_corner_blue",
"subject": {
"gender_presentation": "female",
"age_bracket": "mid_20s",
"ethnicity": "East Asian.
"build": "slim with defined waist; natural proportions",
"skin_tone": "light neutral",
"hair": { "length": "very long", "style": "straight with slight wave ends", "color": "medium brown" },
"pose": {
"stance": "standing, slight contrapposto",
"right_hand": "holding phone in front of face (identity obscured)",
"left_arm": "relaxed alongside torso",
"torso": "subtle arch; midriff visible"
},
"wardrobe": {
"top": "baby-blue cropped knit cardigan, two buttons fastened; blue bralette subtly visible",
"bottom": "denim micro-shorts with blue satin ribbon bows at both hips",
"socks": "thigh-high blue-and-white horizontal stripes",
"accessories": { "phone_case": "blue cute mascot case" }
}
},
"environment": {
"description": "bedroom PC corner seen in a wall mirror",
"furnishings": [
"white desk",
"single monitor with pastel blue wallpaper (no readable text)",
"mechanical keyboard with white keycaps on blue desk mat",
"mouse on small blue mousepad",
"PC tower to the right with blue case lighting",
"three anime figures on/near the PC",
"pagoda poster on wall",
"cat-shaped desk lamp with blue accent",
"clear glass of water",
"tall leafy plant by window (camera-left)"
],
"color_swap": "replace all former pink accents in wardrobe and room with blue (baby blue → sky/periwinkle)."
},
"lighting": {
"source": "daylight from large window camera-left through sheer curtain",
"quality": "soft diffused",
"white_balance_K": 5200
},
"camera": {
"mode": "smartphone rear camera via mirror (no portrait/bokeh mode)",
"focal_length_eq_mm": 26,
"distance_m": { "subject_to_mirror": 0.6, "camera_to_mirror": 0.5 },
"exposure": { "aperture_f": 1.8, "iso": 100, "shutter_s": 0.01, "ev_comp": -0.3 },
"focus": "torso and shorts in reflection",
"depth_of_field": "natural smartphone DOF (deep); background readable, no artificial blur",
"framing": {
"aspect_ratio": "1:1",
"crop": "top of head to mid-thigh; include desk, monitor, PC, and plant",
"angle": "slight downward tilt from mirror viewpoint",
"composition_notes": "keep subject centered; avoid wide-edge stretching by stepping back and cropping square"
}
},
"negatives": [
"pink/magenta accents anywhere",
"beauty-filter/airbrushed skin; poreless look",
"exaggerated or distorted anatomy",
"NSFW, see-through fabric, wardrobe malfunction",
"logos, brand names, readable UI text",
"fake portrait-mode blur, CGI/illustration look"
]
}進(jìn)入:
https://labs.google/fx/zh/tools/flow

上傳生成的圖片,提示詞:展示穿搭。Veo 3.1生成效果如下:
在展示一個(gè)(需要圖像提示詞私我,太長了,這里就不放了):
總之利用nanobanana強(qiáng)悍的生圖能力加上Veo 3.1圖生視頻可以批量的生成各種動(dòng)視小姐姐了,非常逼真
2.Veo 3.1文生視頻
文生視頻,我對比了一下sora 2,感覺確實(shí)還差了點(diǎn),提示詞都是一一樣的:
提示詞1:日式動(dòng)畫電影風(fēng)格的高品質(zhì)2D動(dòng)畫,具有經(jīng)典的賽璐璐手繪質(zhì)感。
一位少女與一條神秘的龍不期而遇,用日語輕聲低語。
畫面中充滿了神秘的發(fā)光粒子、飄逸的織物和虹彩般的光影特效,營造出夢幻的氛圍。
采用多鏡頭合成技術(shù)Veo 3.1 vs sora 2生成對比:sora 2審美感覺還是比較高級,特別像日式動(dòng)漫,怪不得被日本投訴版權(quán)
提示詞2:黑色背景上白色幾何形狀的效果視頻。背景音樂為電子音樂Veo 3.1 vs sora 2生成對比:Veo 3.1的音樂和圖像變化不能匹配

提示詞3:拍攝對象是一位美麗的中國女性,有著干凈整潔的少女形象。
- 白皙透亮的肌膚
- 自然妝容和亮澤雙唇
- 長長的米色卷發(fā)
- 白色短款上衣 + 格子迷你裙 + 厚底運(yùn)動(dòng)鞋
- 明亮的 TikTok 風(fēng)格燈光 ?
?舞蹈創(chuàng)作(每2秒一次) 0-2 秒 - 面朝前方,雙手比心,同時(shí)邁出輕快的一步 - 對著鏡頭眨眼 2-4秒。將右手舉過頭頂,左右擺動(dòng)臀部。微笑并小幅度跳躍。 4-6秒 ?旋轉(zhuǎn)時(shí)雙臂在胸前交叉 ?輕輕甩動(dòng)頭發(fā) 6-8 秒 - 將雙手放在臉旁,做出“閃耀”的姿勢(張開手指) - 跟著節(jié)奏向前邁一步Veo 3.1 vs sora 2生成對比:這是按秒定制舞蹈動(dòng)作視頻,Veo 3.1會(huì)丟失某些動(dòng)作

Veo 3.1更新的核心功能詳情
自五個(gè)月前谷歌推出由Veo驅(qū)動(dòng)的Flow以來,用戶已經(jīng)生成了超過2.75億個(gè)視頻。基于用戶的反饋,本次更新的核心是賦予用戶更強(qiáng)的藝術(shù)控制力和跨所有功能的音頻支持。
新發(fā)布的Veo 3.1模型,在前代基礎(chǔ)上實(shí)現(xiàn)了更豐富的音頻、更強(qiáng)的敘事控制和更高的真實(shí)感,能夠捕捉逼真的紋理。它在將圖像轉(zhuǎn)換為視頻時(shí),也擁有更強(qiáng)的提示詞遵循能力和視聽質(zhì)量
與此同時(shí),谷歌的AI電影制作工具Flow也迎來一系列高級功能,旨在為創(chuàng)作者提供更強(qiáng)的創(chuàng)意控制、音頻支持和后期編輯能力
1.三大創(chuàng)意新功能,全面支持音頻
Veo 3.1為Flow帶來了更完善的場景構(gòu)建能力,并將音頻生成能力擴(kuò)展到了多個(gè)核心功能中,現(xiàn)在,用戶可以通過以下帶有音頻生成的功能來完善敘事:
打造場景外觀:通過“視頻配料 (Ingredients to Video)”功能,用戶可以使用多張參考圖像來控制角色、物體和風(fēng)格。Flow會(huì)利用這些“配料”生成一個(gè)與用戶設(shè)想完全一致的最終場景

控制鏡頭 :通過“起止幀生視頻”功能,用戶可以提供第一幀和最后一幀,F(xiàn)low將生成一個(gè)無縫銜接兩者的視頻,非常適合創(chuàng)作藝術(shù)性和轉(zhuǎn)場效果
創(chuàng)建更長的無縫鏡頭:通過“擴(kuò)展 (Extend)”功能,用戶可以創(chuàng)作時(shí)長達(dá)到一分鐘甚至更長的視頻。每個(gè)新生成的視頻片段都基于前一個(gè)片段的最后一秒內(nèi)容,從而延續(xù)原始片段的動(dòng)作,對于創(chuàng)建長鏡頭或建構(gòu)鏡頭非常有用
2.兩個(gè)編輯新功能,實(shí)現(xiàn)更精準(zhǔn)修改
為了幫助用戶在創(chuàng)作過程中隨時(shí)修改和完善場景,F(xiàn)low直接內(nèi)置了新的編輯功能。
任意添加新元素:使用“插入 (Insert)”功能,可以向場景中添加任何想象中的事物,從現(xiàn)實(shí)細(xì)節(jié)到奇幻生物。Flow現(xiàn)在可以處理復(fù)雜的細(xì)節(jié),如陰影和場景光照,使添加的元素看起來更自然

無縫移除多余物體 :即將上線。用戶將能夠從場景中移除任何物體或角色,F(xiàn)low會(huì)自動(dòng)重建背景和周圍環(huán)境,使其看起來就像被移除的物體從未存在過一樣
3.使用
目前,由Veo 3.1驅(qū)動(dòng)的、具備更強(qiáng)編輯能力和音頻支持的更新已在Flow中提供,此外,Veo 3.1模型也通過以下渠道提供:
Gemini API (面向開發(fā)者)Vertex AI (面向企業(yè)客戶)Gemini app
需要注意的是,新功能在不同平臺(tái)的可用性存在差異:
視頻配料、起止幀生視頻和場景擴(kuò)展功能即將登陸Gemini API。而添加物體和移除物體功能目前在該API上不可用,場景擴(kuò)展功能即將登陸Vertex AI API





























