作者|武靜靜
編輯|蘇建勛
12月26日,Pika 1.0開啟免費公測,普通用戶可以直接上手體驗。
ChatGPT、Midjourney等AI工具爆火以來,給創作、廣告、游戲制作領域帶來了十倍甚至幾十倍的效率提升已經不是新鮮事。但在視頻領域,受制于技術難度和數據集等難題,一直未出現類似文生圖以及文本生成的大規模的應用。
一個月前Pika1.0發布,從宣傳片上來看,相比此前的AI生成視頻產品,Pika1.0在流暢性、畫質和風格準確性表現堪稱完美,讓很多人眼前一亮。
Pika1.0體驗起來手感究竟如何,此次,我們直接上手體驗了一番。
亮點功能:一鍵編輯、圖生視頻、畫布延展
進入Pika官網(官網地址:https://pika.art),首頁是Pika生成的作品廣場,右側則是用戶的個人作品列表。
截圖自Pika官網首頁
官網最下側欄目就是提示詞入口,可以直接輸入提示詞和風格類型,也可以上傳照片。
在輸入提示詞之后,還需要選擇點擊提示詞窗口右下側三個符號,通過調整畫面比例,運動強度,輸入反向提示詞等來功能,讓Pika生成的視頻更貼合需求。
畫面比例上可以根據需求選擇想要的尺寸,每秒幀數可以選擇默認的24,也可以結合自己需求調整。
選擇視頻畫面比例
Strength of motion指的是運動強度,數字越大,視頻中動作變化越快。
選擇鏡頭運動角度
反向提示詞是Pika1.0一個獨特的功能,輸入類似“變形、噪點、質量差、失真、繪制不佳、模糊、顆粒感、分辨率低、飽和度過高、缺乏細節、照明不一致”等提示詞,可以優化生成的視頻效果。
輸入反向提示詞
這些設置完成后,就可以在自己的作品列表等待視頻。等待過程一般在幾十秒或1分鐘以上,期間,也可以繼續輸入提示詞創作新視頻。
比如,輸入提示詞“A little girl wearing a red hat is crying in the snowy field,anime style”后,等待了大約10秒鐘,Pika制作出了這段視頻。
輸入提示詞“一個帶著紅色帽子的小女孩在雪地里哭泣”,Pika生成了該視頻。
效果不好,也可以選擇Retry鍵,多生成幾個視頻,再篩選。
Pika最驚艷的是一鍵編輯功能,用戶可以直接選定要調整的區域,輸入提示詞,編輯視頻。
選中編輯前文中生成的視頻,輸入提示詞"戴上墨鏡",就有了下面的效果。
選中視頻中小女孩眼睛區域,輸入提示詞"戴上墨鏡",Pika生成了該視頻
除了戴墨鏡這種有趣的嘗試,Pika的一鍵編輯和圖生視頻功能在商業層面將發揮巨大的價值,尤其會給營銷廣告視頻制作領域帶來極大的效率提升。
以這張模特圖片為例,上傳照片給Pika。
圖片來自IC photo
靜態的圖片就轉化成一段活靈活現的動態視頻,整體效果不錯,但視頻中的人臉比照片顯示更虛一點。
視頻由Pika生成
選中視頻中模特衣服,輸入提示詞“給模特穿上牛仔背心”。
選中視頻中要編輯的區域,輸入提示詞
一個換裝成功的模特立馬出現。
輸入提示詞”給模特穿上牛仔背心”,Pika生成的視頻
如果你覺得只有上半身效果不夠,也可以編輯中選擇一鍵擴圖。輸入提示詞“穿著牛仔褲”,選擇4:5畫布,就可以生成新的模特視頻。也可以點擊延長4s這個功能,增加視頻時長。
選擇增加4s,延長視頻時長
也有測試失敗的作品。同樣是上面這張模特圖片,我們試圖把模特視頻轉換成3d風格,但效果不如人意。
截圖來自Pika
可見,雖然目前Pika1.0宣稱支持3D動畫、動漫或電影等各種類型內容生成,但在測試中發現,在視頻風格轉化功能上,Pika產品尚需改進。
Pika的殺手锏:無門檻上手
產品體驗上,和各類AI生成視頻的工具產品相比,Pika最大的特征就是易用性,可以無門檻上手。
此前,視頻類工具都需要掌握一些專業的工具技能才能不斷調試,過程復雜,比如Runway提供的Photoshop筆刷和圖層等功能對普通用戶而言很難上手,更適合專業用戶。
但使用Pika的過程中,各類功能簡單直接,且二次編輯、畫布延展等功能都在產品界面直觀看到,對小白用戶的上手體驗非常友好。
在一次采訪中,Pika創始人郭文景曾提到,創立Pika的契機正是發現了AI視頻工具的專業門檻過高,對普通人不友好。
2023年年初,郭文景和幾位朋友參加了Runway 舉辦了第一屆 AI movie Festival,但在實際制作過程中,他們發現視頻工具非常復雜,且使用門檻很高,普通人很難學,即便專業人士,也需要花大量時間用工具反復調試。“比如換個背景,幾秒鐘的內容要制作幾小時,軟件還經常crash。”
也是這次經歷,郭文景決定創立Pika這個項目。郭文景曾說,AI 的出現,應該讓視頻制作變得更簡單。
同時為了讓更多普通人能更高效創作視頻,Pika也試圖創造更簡單的二次編輯體驗,過程中,用戶只需要輸入具體的動作提示詞,就能通過簡單的標準化動作調試視頻。
“一鍵編輯+圖轉視頻+擴圖”,有了這三項能力,視頻制作門檻大大降低,甚至未來只需要一張簡單的平面照片就成了完成視頻的全流程制作,不需要模特去現場。
此前,Pika曾發布一款用Pika Beta 2.0制作的廣告短片,該短片翻拍自一支舊廣告,原片由30個人耗時一月完成,使用Pika Beta 2.0,僅由一個人,用了不到一天時間,效率提升了幾十倍。可見未來,廣告制作以及各類營銷創意視頻使用Pika也將迎來幾十倍的效率提升。
隨著Pika的爆火,更多普通人開始上手體驗新的視頻工具,整個文生視頻市場也將進一步被打開。
當然,整個AI生成視頻領域也還在爬坡階段,且屢被吐槽宣傳片和實際效果不符,雖然Pika 1.0在一些體驗上已經有了新的亮點,但在整體的邏輯連貫性、流暢性、畫質和風格準確性上,以及復雜邏輯動作嘗試上,效果也有限。
比如輸入“一個帶著紅色帽子的小女孩和一只狐貍在雪地里跳舞,anime style”,會發現,Pika并沒有生成一只狐貍,而是生成了一個帶著狐貍帽子的人。
視頻由Pika生成
這也是Runway、Genmo、Imagen Video 等AI視頻產品一直面臨的一個難點。相比文生圖,文生視頻本身的技術難度比較復雜,前者考驗的是“作圖能力”,后者考驗的則是作圖、理解、邏輯等多重能力。
所以,AI生成視頻工具不僅需要掌握基礎的自然語言理解能力,還需要在畫面流暢度、風格準確性、穩定性、一致性、動作連貫性等方面有較好的表現。
眼下,這個領域還沒有一款產品能夠像ChatGPT和Midjourney一樣,能產出高于用戶預期的作品。
誰會是下一個真正在體驗上驚艷用戶的產品?讓我們拭目以待。