[PConline 雜談]AI絕對可以稱得上是這幾年最火爆的話題。從Alpha Go擊敗頂尖圍棋選手開始,越來越多人意識到在很多領域,AI已經能夠用接近人類的思維,更高效地完成任務。在很多領域,AI甚至已經可以涉及甚至部分取代之前只能由人類擔任的工作,例如機器翻譯有了AI加持后,譯文的質量在很多場景下已經達到了可用的程度,電腦和互聯網變得越來越聰明了。
▲AI加持的翻譯GNMT比之前的PNMT更加接近人工翻譯
然而長久以來,很多人依然認為,在一些體現人類獨創性思維的領域,仍是AI的禁區。例如藝術和繪畫,很難想象出AI能和人的想象力和手藝一較高下。
但是,近年AI在圖形學的進展,卻讓人驚呼時代真的變了!不少高質量的AI繪畫方案紛紛面世,即使你完全不會畫畫,憑借著寥寥幾筆涂鴉,甚至簡單一兩句乃至幾個詞的描述,就能夠通過AI生成美輪美奐的繪畫,簡直如同黑科技,尤其是最近在Google Colab開源的Disco Diffusion,全世界都玩瘋了!
▲Disco Diffusion已經可以繪制如此高質量的圖畫了!
AI繪畫并不是一蹴而幾的,它隨著算力的增強,以及算法的完善,慢慢修煉到了如今的功力。那么在這幾年,都有些什么令人印象深刻的AI繪畫方案?今天,就來介紹一些相當值得把玩的AI繪畫,來看看AI在如何一步步在藝術領域挑戰人類的吧。
Paintschainer
這可能是最早出圈的AI繪畫方案了。Paintschainer在早幾年就引起了人們的注意,它并不能完全靠自己來畫一幅畫,Paintschainer的主要作用是給線稿上色,其效果已經可以追上一些比較簡陋的人工上色作品。
Paintschainer GitHub主頁:https://github.com/pfnet/PaintsChainer
Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html
Paintschainer在當時之所以突然爆火,是因為人們突然發現,AI居然是可以辨認線稿內容的!Paintschainer的驚人之處,在于它能夠識別線稿的內容,例如一張美少女人像,它可以識別某部分屬于皮膚,某部分是頭發,某部分是衣服,某部分是背景,然后分別涂上適當的顏色。不僅如此,它的上色范圍還相當精準,盡管線稿沒有封閉,但顏色依然會保留在適當的范圍,而不會涂得滿地都是——用過PS中油漆桶工具上色的朋友,應該知道這是什么意思。
▲AI可以分辨對于電腦來說很抽象的線稿,并自動上色
▲使用簡單的彩色線條作顏色指定ho后,上色更精確,效果甚至已經和人工上色不相上下了
在很多人的固有認知中,電腦很難“理解”圖像,從照片中辨認、總結出內容物是什么。然而Paintschainer卻做到了更高的層次,能夠“理解”線稿這樣比起寫實照片更加抽象的圖像。盡管Paintschainer并不完美,但它已經足以讓人們對于AI的強大有了更加貼切的體驗。
NV GauGAN
NV是顯卡界的大拿,無數游戲玩家將老黃視為偶像。而NV同樣是AI算力的重要貢獻者,它早早在AI領域布局了多枚棋子,到如今NV在AI領域無論是硬件還是配套的軟件,都達到了很高的水平——游戲玩家如果用過NV增強畫質的DLSS AI算法,一定深有體會。
DLSS并非是NV在圖像AI領域的唯一體現,實際上,NV近年的一個開源AI項目SPADE/GauGAN,就讓人嘖嘖稱奇。
NV SPADE GitHub主頁:https://github.com/NVlabs/SPADE
NV GauGAN 2 Demo:http://gaugan.org/gaugan2/
GauGAN是一個NV使用AI生成圖像的方案,和上文介紹的線稿上色AI相比,GauGAN的強大之處就在于它可以生成完成度極高的圖像,而前提是只需要你涂抹幾筆,用不同顏色的色塊和線條意思一下,GauGAN就可以明白你的意思,還你一張逼真度極高的照片。
而GauGAN一直處于發展中。今年,GauGAN還推出了第二代,除了依然可以通過簡筆畫生成照片,現在還能夠通過文字描述來生成圖像了!
在GauGAN 2當中,用戶只需要輸入描述畫面的文字,AI就可以自動生成對應的畫面。而且,生成的速度非常驚人,幾乎就是即時的。例如下圖,輸入“Ocean”出現海,繼而輸入“waves”則會出現波浪,繼續輸入“hitting rocks on the beach”則又繼續生成海灘和巖石,效果非常驚人。
此外,GauGAN還支持用戶手動涂抹修改。如果想要對生成的內容做調整,就可以直接用簡筆涂鴉,AI會如魔法般變出逼真的對應內容。
GauGAN之所以有如此大能,是因為使用了對抗網絡,大量數據經過機器訓練后,使用生成器和鑒別器來識別對應元素,從而匹配數據生成圖像。據了解,GauGAN 2使用了1000萬張圖像進行訓練,藝術家使用它不僅可以生成現實的風景,還可以生成天馬行空的藝術場景,這超越了很多人以往對電腦插手藝術的固有印象。
Disco Diffusion
這可能是今年最為人矚目的繪畫AI了!Disco Diffusion一經面世,就刷爆了全球各大社交媒體,它顛覆了很多人對AI的認知。
▲你敢相信,這是AI作出來的畫?
如果說GauGAN的強大之處,在于可以憑借人的簡單想象就生成逼真圖像,那么Disco Diffusion就更進一步,不僅可以進行復雜的想象,而且還可以生成各種畫風的繪畫!
Disco Diffusion是一個運行在Google Colab上的AI,如果要使用它,需要擁有Google賬號并且能訪問Google,國內的用戶可以自行解決這方面的問題。Disco Diffusion的程序是面向公眾公開的,在使用之前,我們可以先將其保存到自己的Google Drive網盤,以方便進一步的編輯。
Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Disco Diffusion GitHub主頁:https://github.com/alembics/disco-diffusion
Disco Diffusion的強大之處,在于你給出一段描述文字,就能夠生成高質量的畫作。盡管它沒有圖形界面,但使用起來并不復雜,進入到“Setting”當中,可以設置名稱(AI生成的繪畫會保存到Google Drive中對應的文件夾)、尺寸(不要設置太大,保持默認即可)、步數(保持默認即可)等等。
接著,進入到“Prompts”(提示詞)的設置當中,這就是最關鍵的地方了。在Prompts中,你可以輸入描述繪畫的詞句,例如官方給出的實例為“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致為“奇異燈塔的美麗繪畫,在洶涌的血海中閃耀著光芒,參考greg rutkowskiThomas kinkade的畫風,以及artstation網站上流行的風格”“黃色主調”。
然后點擊“代碼執行程序”中的“全部運行”,靜靜等待即可。運算過程可能長達幾十分鐘乃至數小時,運算是在Google的云服務器上運行的,對本機電腦性能沒要求。隨后,Disco Diffusion就生成了這樣一副繪畫!
在很多人眼里,AI能夠生成這樣的一幅畫是非常驚人的,其完成度甚至不屬于一些真正的畫手。而Disco Diffusion生成這樣的一幅畫,流程要比手工作畫來得更快,而且改一下提示詞,又能生成另外不同風格的畫了。
▲同樣的Prompts提示詞,僅僅更換了作者風格的關鍵字,Disco Diffusion就可以生成不同的畫風
Disco Diffusion對提示詞的要求很寬松,完全可以用簡單的詞語,甚至是機翻來應對。例如筆者填入了“a modern city at night,super wide angle,artstation”這樣簡單的Prompts,就生成了下面這幅畫作。
Disco Diffusion有很多潛力可發掘。例如使用算力更強的云服務、設置更多次的迭代算法、提供更具體的提示詞、甚至給到參考圖片,都能夠生成更高質量、更多種風格的畫作。下面是一些來自互聯網的利用Disco Diffusion生成的作品,大家可以感受一下。
▲Prompts:The Vast Viridescent Hillside lacks Rationality and obfuscates its Beauty
▲Prompts:when you have taken everything away, what remains? will you walk this road all the way to the heart of the galaxy?
▲Prompts:forbidden aesthetic
毫無疑問,Disco Diffusion的出現,顛覆了很多人的三觀。這個AI所生成的繪畫,甚至已經可以說擁有一定的藝術感了。盡管它對于動物和人物的繪制仍存在短板,而且也并不能勝任人物、場景設計這樣具體的、需要扣細節的工作,但無論是給普通人一場視覺盛宴,還是給行業人員找找靈感,都已經綽綽有余了。
可以說,Disco Diffusion將繪畫AI推向了一個新高度,繪畫這種講究審美、講究靈感的技藝,也不再專屬于人類了。
Tiamat
Disco Diffusion依托在Google Colab上,對于國內用戶來說有網絡方面的門檻,而且界面說不上易用,還需要用英文來撰寫提示詞(盡管可以機翻)。現在,對國人更友好的AI繪畫方案,正在路上。
最近,一款名為Tiamat的繪畫AI在國內展開了測試。根據內測者微博用戶 @春卷 的體驗反饋,它的界面比較友好,而且可以用中文來給AI命題,效果還相當不錯。
和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根據詩詞來繪畫,畫面效果相當好,還頗有意境。在微博、小紅書平臺上,都可以找到很多這樣的案例。
▲Prompts:天蒼蒼,野茫茫,風吹草低見牛羊(來自微博 @春卷)
▲Prompts:海壓竹枝低復舉,風吹山角晦還明(來自小紅書 @青柑普洱不甜_Tiamat)
▲Prompts:簾卷落花如雪,煙月,誰在小紅亭(來自小紅書 @5+1=6)
可見,Tiamat的AI方案還是有吸引人的獨到之處的。不過目前Tiamat目前仍處于內部測試階段,如果想要親自體驗,可以通過下面的鏈接來申請測試資格。
Tiamat內測申請:https://tiamat-ai.feishu.cn/share/base/shrcn2uXL8wNiveykIFYqWSzsPf
希望Tiamat能夠盡快推出公開的版本,讓更多國人感受到AI繪畫的魅力吧。
總結
隨著硬件性能的進步以及算法的改進,AI仍在飛速發展。AI在繪畫方面的建樹,已經讓人咋舌,大家有條件的話,強烈推薦把玩一下Disco Diffusion,感受AI作畫的魅力。未來AI會在更多方面挑戰人類的靈智嗎?我們拭目以待吧。