想像如果你是世界知名電影導演,你腦中突然浮現一個畫面:一位身穿復古太空衣的太空人,騎著一匹駿馬,在火星的紅色沙漠上馳騁,遠方雙子衛星緩緩升起。過去,要將這個畫面變為現實,你需要一支龐大的電影拍攝專業團隊、昂貴的攝影器材、攝影場地以及實力堅強的後期製作特效人員等等。如今生成式AI技術的進步,讓上述有如電影磅礡的畫面,僅需要你透過撰寫「提示詞」文字就可得到。
Google DeepMind 推出的旗艦級影片模型—Veo,正在顛覆人們的想像。賦予全球數百萬創作者、行銷人員與夢想家,將腦中想像天馬行空的畫面化為真實影像的工具。
Veo 並非簡單地將文字轉譯成動態畫面,它不僅只是「動態」,還能理解各種專業攝影技巧,例如攝影機的移動、光線的呈現,甚至是畫面的構圖,讓生成的影片看起來更精緻、自然。以下是有關Veo生成的特點:
高畫質與長時序:電影級的視覺體驗
過去的 AI 影片往往受限於幾秒鐘的長度與模糊的畫質。Veo 徹底打破了這個僵局,它能生成超過一分鐘、具備 1080p 高解析度的影片。這意味著你的創作不再是破碎的片段,而是可以生成一短完整的故事畫面、擁有影院級質感的視覺作品。
畫面連貫性:讓你的角色「活」起來
Veo 的一大技術突破在於其卓越的時序連貫性。當你指令「一個小男孩穿著紅色雨衣追逐著氣球」,在長達一分鐘的影片中,這個小男孩的樣貌(包括臉部)、雨衣的顏色,甚至氣球的動態會保持高度一致。而相較於近年影像畫面用於影視作品上面由於不具穩定性,影像的人事物會出現不停閃爍狀況,故生成畫面是否有穩定的主體和期望的背景,是影片生成的重要條件,使用Veo可以不用再擔心同一個角色在不同場景中出現「變臉」情況,維持角色一致性。
深刻的物理與語意理解:它懂你的「言外之意」
Veo 不僅認識名詞,更理解動詞、形容詞以及它們背後的物理世界規則。當你描述「跑車在濕滑的賽道上甩尾」,Veo 會自動生成輪胎濺起的水花、車身的動態模糊以及光線在積水上的反射。更重要的是,它能精準理解專業影視術語。你可以直接下達指令,例如:
縮時攝影 (Timelapse)
:Veo 會自動壓縮時間,呈現雲朵流動或城市變遷的壯麗景象。
空拍鏡頭 (Aerial shot)
或 無人機視角 (Drone footage)
:Veo 會模擬從高空俯瞰的視角,給予畫面宏大的空間感。
多元的輸入模式:在現有基礎上盡情創作
Veo 的創作起點不限於文字。它支援多模態輸入,極大地擴展了應用場景:
圖片+文字 (Image-to-Video): 上傳一張人物設計圖或產品照片,然後用文字指令「讓這個機器人角色在雨中的霓虹東京街頭行走」,Veo 會讓你的靜態圖片動起來。
影片+文字 (Video-to-Video): 提供一段現有影片,你可以要求 Veo「將這段影片的風格轉換為日本動畫」,或「在影片的背景中加入一艘飛過的太空船」,實現高效的影片編輯與特效添加。
剪輯特效一把抓:讓你輕鬆使用後製魔法
在影片中添加或移除物體,甚至用「影像擴展」(Outpainting)功能擴展畫面,讓影片看起來更廣闊。
如果說 Veo 是一個技術精湛的製作團隊,那麼「提示詞 (Prompt)」就是你遞給團隊的劇本和分鏡表。劇本寫得越好,成品就越接近你的想像,而身為國際知名導演的你將再次推出讓全球讚嘆的曠世巨作。
基礎結構:黃金公式
一個優秀的提示詞,就像一個清晰的句子,包含了所有必要的元素。初學者可以從這個黃金公式開始:
[主體 (Subject)] + [動作 (Action)] + [場景細節 (Scene Details)] + [環境氛圍 (Atmosphere/Mood)]
範例:
想法: 一隻狗
套用公式:
一隻黃金獵犬 (主體)
在海灘上奔跑 (動作)
追逐著一個紅色飛盤,濺起白色的浪花 (場景細節)
在溫暖的日落餘暉下,畫面呈現電影感 (環境氛圍)
最終提示詞:一隻快樂的黃金獵犬在海灘上奔跑,追逐著一個紅色飛盤,濺起白色的浪花。在溫暖的日落餘暉下,呈現電影感、慢動作鏡頭。
進階指令:讓影片更專業
當你掌握了基礎結構,就可以開始像導演一樣思考,透過更專業的詞彙精準控制畫面。
鏡頭語言 (Camera Work):
視角與景別: 廣角鏡頭 (Wide shot)
、遠景 (Long shot)
、中景 (Medium shot)
、特寫 (Close-up)
、臉部極特寫 (Extreme close-up)
角度: 鳥瞰視角 (Bird's-eye view)
、由下往上拍 (Low-angle shot)
、過肩鏡頭 (Over-the-shoulder shot)
運鏡: 平移鏡頭 (Panning shot)
、推軌鏡頭 (Dolly shot)
、跟拍 (Tracking shot)
、手持攝影感 (Handheld camera style)
燈光與色彩 (Lighting & Color):
光線氛圍: 黃金時刻 (Golden hour)
、藍色時刻 (Blue hour)
、電影感光線 (Cinematic lighting)
、戲劇性光影 (Dramatic lighting)
、柔光 (Soft light)
色彩風格: 鮮豔的色彩 (Vibrant colors)
、柔和的色調 (Pastel colors)
、黑白電影 (Black and white film)
、賽博龐克霓虹燈 (Cyberpunk neon)
風格定義 (Artistic Style):
媒材: 皮克斯3D動畫風格 (Pixar 3D animation style)
、日本動畫 (Japanese anime)
、水彩畫風格 (Watercolor painting)
、黏土動畫 (Claymation)
時代與流派: 80年代復古科幻電影 (80s retro sci-fi film)
、黑色電影 (Film noir)
、超現實主義 (Surrealism)
範例模糊 vs. 精準:
A car driving fast.
(有一輛車開得很快)A vintage red sports car drifting around a sharp corner on a mountain road at dusk, low-angle shot, motion blur, cinematic lighting.
(一輛復古紅色跑車在黃昏時分於山路急彎處甩尾,低角度拍攝,帶有動態模糊,電影感光線。)優化技巧:
blurry, grainy, poorly lit, amateur
(模糊、顆粒感、光線差、業餘) ,就會降低生成畫面不佳的比例,來確保畫面的品質。用三個不同領域的應用案例,來讓大家。
目標: 為一款名為 "Aura" 的香水製作 15 秒的社群媒體廣告,強調其自然、清新的特點。
提示詞範例:An elegant perfume bottle named "Aura" rests on a mossy rock in a misty forest. A sunbeam shines through the canopy, illuminating the bottle. A gentle breeze causes dewdrops on nearby leaves to tremble. Macro shot, slow motion, extremely detailed, cinematic, ethereal atmosphere.
拆解分析:
主體與場景: elegant perfume bottle... on a mossy rock in a misty forest
直接設定了產品與背景。
動態與細節: sunbeam shines... dewdrops tremble
增加了畫面的生命力與精緻感。
鏡頭描述: Macro shot
(微距鏡頭) 強調細節,slow motion
(慢動作) 營造高級感,ethereal atmosphere
(空靈的氛圍) 扣合產品調性。
目標: (使用圖片+文字功能)讓一個已設計好的機器人角色,在科幻城市中執行任務。
輸入: 一張機器人正面設計圖
提示詞範例:Make this robot walk through a crowded, rainy cyberpunk city street at night. The robot's metallic surface reflects the vibrant neon signs from the surrounding buildings. People with glowing umbrellas walk past. Tracking shot following the robot from a low angle.
拆解分析:
核心指令: Make this robot walk
賦予靜態圖片生命。
環境互動: reflects the vibrant neon signs
讓角色與環境融為一體,極大提升了真實感。
氛圍營造: crowded, rainy
, glowing umbrellas
豐富了場景,使其更具故事性。
鏡頭描述: Tracking shot... from a low angle
讓觀眾跟隨角色,增強了代入感。
目標: 生成一段展現宏偉自然景觀的影片素材。
提示詞範例:An epic timelapse of the Northern Lights (Aurora Borealis) dancing over a snowy mountain range in Iceland. The stars rotate in the night sky. Ultra-wide angle, 8K, hyper-realistic, vivid colors.
拆解分析:
核心指令: 直接使用 Timelapse
和 Northern Lights (Aurora Borealis)
,Veo 能立刻理解其視覺表現形式。
地點與元素: snowy mountain range in Iceland
, stars rotate
提供了具體的場景構成。
品質要求: Ultra-wide angle
捕捉廣闊的景象,8K, hyper-realistic, vivid colors
確保了最終成品的視覺衝擊力。