" 什么,這居然是 AI 畫的!?"
這可能是我在過去一個月的互聯網上看到過的最多的評論。
當我們對于當代 AI 繪畫的印象還停留在僅僅只是畫個人像時,AI 的 " 畫技 " 卻在不知不覺中在飛快提高著。
也就是這么幾個月的時間,DALL · E 2、Stable Diffusion、Mid Journey 等 AI 繪畫工具突然帶領了一波爆發式的創作,帶來了無數精美的藝術繪畫作品,藝術界那叫一個熱鬧。
現在去網上隨手用關鍵詞一搜,你就能夠找到大量 AI 繪制的精美圖片,其中絕大部分用來當個手機壁紙、電腦桌面啥的綽綽有余。
這鮮明的風格、細膩的筆觸、精心的構圖,我要說是 AI 畫的,你信嗎?
Mid journey 的社區展示 ▼

你絕對沒法想象,在一年多之前,這些 AI 繪畫工具還指揮做一些類似 " 縫合 " 的活兒,畫出來的東西也都抽象得很,沒幾個能看的。
就拿 DALL · E 來說,去年差評君曾經給各位介紹過它,你們看看那時候它畫出來的都是啥玩意兒。

一年之后的 DALL · E 2 的作品則是這樣的。

這畫技的提升速度簡直比莎翁筆下的某對年輕情侶感情升溫還要快了好嗎!
你看,AI 的可怕之處就在于這兒,每當你覺得 ai 江郎才盡的時候,它都能給你整出一些驚掉下巴的活。
既然這事兒最近那么火,不如今天我們就聊聊 AI 繪畫吧。
很多人可能會覺得,AI 繪畫是這兩年才出現的新玩意兒,但是實際上它的歷史比我們想象得都要久遠得多。
在上世紀 60 年代,一個叫做哈羅德 · 科恩( Harold Cohen )的英國藝術家在倫敦藝術圈子里漸漸有了名聲。
作為一名正統藝術教育培訓出身的藝術家,按理說這對他來說已經是天胡開局了,接下去只要按部就班就可以功成名就走上人生巔峰。
右邊是科恩 ▼

結果他卻開始把主要精力卻都放在了學習寫代碼、開發電腦程序上。
不過,他學代碼不是為了轉行當程序員,而是想用計算機來幫自己進行藝術創作。
在幾年的學習之后,科恩在 1973 年發布了一個叫 Aaron( 亞倫 )的程序,它就是最開始的計算機繪畫程序。
這款程序可以模擬人手畫出一些不規則的線條,在畫完之后科恩會用染料手動為這些圖片上色。

沒錯,在這個階段,Aaron 的能力僅僅局限于此,甚至都不能指定它去畫某一樣東西,只有在科恩給它上色之后,才會成為完整的抽象畫。
可以說,此時的 Aaron 只是個輔助而已,真正的大哥還是科恩本人。
即便只是這樣,科恩這種突破性的創作方式還是在當年引起了很大的轟動,他的作品還被拿去進行了一波展覽。

科恩并不滿足于此,他想讓 Aaron 可以獨立創作出一副完整的作品。
要做到這一點,Aaron 就必須要 " 學會 " 畫出指定的圖案以及之后的上色等工作。
于是他又開始對 Aaron 的代碼進行改進,這一改就是十年的時間,1980 年代,Aaron 學會了畫巖石、植物、人等事物。

之后科恩還把 Aaron 的編程語言從 C 語言換成了 Lisp,用來解決顏色的問題,直到 2000 年初,總算是可以獨立完成作品了。

Aaron 的藝術作品在當時得到了各行各業的認可,被很多博物館收錄展覽,甚至被用來作圖靈測試的藝術題目。

科恩本人也因為 Aaron 而獲得了杰出藝術家獎數字藝術終身成就獎。

但看到這兒各位應該也發現了一個問題:這 Aarron 雖然能畫畫,但是進化速度很慢,動不動就要十年為單位才能進步一點。
而且它自身也沒有任何的 " 創造力 ",任何新的圖案、畫風,都需要科恩手動編碼進行調校才能學會。
另外,2000 年之后,一些別的計算機繪畫程序也開始逐步發展起來,比如 The Painting Fool,它的原理是模擬物理繪畫的過程,看著真實的照片然后對區域內的色塊進行提取,然后模擬鉛筆、油漆之類的材料進行創作
它比較有突破性的一點是學會了識別情緒,可以根據情緒變化來繪制肖像。

之后還有了 3D 建模能力。

但是它們有一個共同的特點就是局限性很大,大多都是人像,就這樣這些人像還需要后期加工才能比較像真人。
最關鍵的是,它們沒有自己的意識,并不知道自己畫的是什么東西。
因此那時候,藝術家們并不認為計算機能夠威脅到自己的地位,畢竟在 " 創意 " 這事情上,還得是人類說了算。
可他們沒想到,隨著 AI 技術的不斷發展,一場全新的變革在不久之后就到來了。
2014 年,Ian Goodfellow 提出了一個叫做生成對抗網絡( GANs,Generative Adversarial Networks )的東西,迅速成為了 AI 行業的研究熱點。
簡單點說,GANs 的原理就是 " 左右互搏 "。
首先我們有兩個東西,G( Generator ,生成器 )和 D( Discriminator ,識別器 ), G 的功能是隨機生成一張圖片, D 則是來判斷這張圖片是不是真實的(是人還是由 G 生成的 ),讓兩邊一直不停的打架。
G 的目標就是盡量生成以假亂真的圖片把 D 忽悠過去, D 的目標則是盡量識別 G 的圖片與真實圖片的區別。

最后,我們就能得到一個可以生成更接近 " 真實 " 圖片的 G。
GANs 的出現讓計算機繪畫有了一個巨大的飛躍,因為在這種情況下,經過大量訓練的 AI 完全知道自己應該去 " 畫 " 什么。
比如你可以讓它畫一個動漫人物頭像,它就會給你一個動漫人物頭像,而不會給你一個猩猩頭像、或者一張小李子玩水槍的圖。

與之前的繪畫程序相比,這種認知上的差距就好像是一個懵懂的嬰兒與成年人一樣巨大。
但是在這個時候,AI 還是沒有 " 創造力 " 可言的,它只是根據自己 " 記憶中 " 的東西去生成差不多的圖片而已,說白了就是模仿,沒有特定的風格。
2017 年,基于 GAN 的理論,羅格斯大學發表了 CANs( 創造性對抗網絡 )的概念,首次讓 AI 產生了創造力。
CANs 的基本原理和 GANs 差不多,但是在訓練過程 CANs 還會學習將圖片分為 25 種藝術風格( 抽象、寫實等等 )。
這樣一來,當你使用 CANs 時,還可以給定具體的風格,之后就可以看到 AI 的 " 創造力 "。

至此,AI 有了識別能力,有了創造力,GANs 訓練模型在之后的幾年里 " 壟斷 " 了 AI 界,出盡風頭。
可是正如同之前說的 DALL · E 一樣,它們是有一些缺陷的。
原因是 GANs 和 CANs 的訓練過程是 G 和 D 兩者的抗爭,相當于是個黑盒子,我們也無法針對性地讓它們訓練各種繪畫的細節,只能有個大概的方向。
所以我們之前看到的那些 AI 圖片總會覺得它們有些粗糙。
然后在 2021 年 5 月份,OpenAI 的工作人員提出了一個叫擴散模型( Diffusion Models )的系統,它也是在短短一年多里讓 AI 繪畫技術飛速提升的關鍵所在。
擴散模型的原理可以粗略地理解為:連續不斷地添加高斯噪點把一張圖片給 " 打碼 ",然后反轉這過程,學習如何恢復圖片,也就是 " 去馬賽克 "。

這個過程其實是相當于從像素層面去 " 畫 " 出原來的圖片,什么地方畫貓眼睛、貓的毛色應該是什么樣的都一清二楚,自然就可以讓 AI 生成的圖片擁有大量的細節。
經過無數次的訓練之后,擴散模型就擁有了可以把隨機給出的一堆噪點變成一張圖片的能力。
擴散模型一出現就被證明了有遠超 GANs 的訓練效果,而且擴散模型的訓練過程不需要對抗,還可以添加各種規則和約束來針對性地訓練。
于是乎,我們開頭看到的那些能生成精美圖片的 AI 就這樣出現了。
如今,AI 繪畫的能力以及應用領域已經遠超我們的想象,它甚至還在以飛快的速度在不斷進化,仿佛已經來到了技術奇點。
比如我最近也試了試用 Mid Journey 進行了一波 " 創作 "。
哪怕我輸入的只是阿拉伯數字 " 4 " ,它也可以給我生成一組圖片,只不過有點意義不明。

甚至于我還可以選擇 " Upscale " 讓它畫出這些圖片更細節的東西。

而當我嘗試用一些比較精準的語句去形容我想要的畫面時,它給出的結果也是完全對應了我輸入的描述。

當然,我的這些作品純屬是練手而已,專業人士們早就把它們用在自己相應的領域中了。
有些游戲制作者已經在嘗試完全用 AI 生成的素材做游戲。

有位藝術家則用 AI 創作了 40 多頁擁有連續劇情的漫畫,僅僅只花了一個小時。

甚至于,今年戛納電影短片節最佳短片《 THE CROW 》都是 AI 繪制的。

由此可見,很大一部分的藝術創作者對于 AI 繪畫是持有包容態度的。
但是,也有人在感嘆再這么發展下去 AI 可能會讓許多藝術家失業了,并表達了前所未有的憂慮。
也有人反感 AI 繪畫,如同當年杜尚說出 " 繪畫已死 " 時一樣,高呼著 " 藝術已死 "。
一位桌游老板用 AI 繪制的畫
獲得了繪畫大賽項目一等獎 ▼

其實我覺得這取決于我們如何去看待 " 藝術 "。
就拿我的作品來說,那肯定算不上藝術對吧,我只是隨便輸入了幾個句子,讓系統生成了一張圖片而已。
那些大佬們則是會通過不斷地調試參數和條件,讓 AI 繪畫達到自己想要的效果,甚至進行后期調色、細節打磨,這個過程本身難道不也是一種藝術創作嗎?
圖片來源微博 @soulframe ▼

更何況,哪怕是現在基于擴散模型的各種繪畫 AI ,它們依舊是有缺陷存在的。
比如下面這張溫斯頓,在我們普通人看來會覺得 " 哇,好華麗,細節好多 "。

可是在真正的大佬眼里,這身盔甲的設計就很愚蠢。
究其原因,是因為現在的 AI 繪畫還是 " 知其然,而不知其所以然 " 的狀態。
誠然,它知道溫斯頓是誰,卻不知道溫斯頓為什么要穿盔甲,更不知道盔甲該如何設計才合理,它只是按照要求畫了張圖而已。
更不用說一些抽象的概念,比如輸入 " 鮭魚洄游 ",有些 AI 生成的結果非常令人迷惑,因為 Salmon 在更多的情況下都是用在三文魚片這個場景。。。

很多創作者都認為,AI 可以把畫功、筆觸、透視等人類需要刻苦練習的東西在很短的時間之內學會,這其實是一件好事。
畢竟 AI 繪畫不可能理解一個甲方給出的所有需求與修改意見,但是一個專業的藝術家可以。
但是 AI 作畫確實可以在構圖、色彩選擇等方面給藝術家提供靈感。
這就可以讓藝術家們脫離那些機械、重復的勞動,把更多的精力集中在創意內容上。
藝術家們留下的藝術品,是他們所處的時代以及自身獨特思想激烈碰撞之后的產物。
AI 繪畫說到底也只是一個工具而已,它的出現,能更好的幫助藝術家們記載這整個時代,而不會將那些真正的藝術家取代。
原文地址:http://www.myzaker.com/article/632c87578e9f096f43384aba