機器之心報道
編輯:杜偉、陳萍
修改一張圖,一句話的事就搞定。
輸入一句話,就能把圖片修改好,這是很多畫師夢寐以求的修圖工具!但是話說回來,再優(yōu)秀的畫師,如果僅憑自己的專業(yè)優(yōu)勢,不借助其他工具,也很難在短時間內(nèi)完成圖片的修改。
現(xiàn)在好了,AI 正在向圖片生成領域發(fā)起挑戰(zhàn),各大科技公司、高校等開始紛紛涉足。最近一段時間,關心 AI 圈的人可能都有這樣一種感受:擴散模型被越來越多的人提及,基于擴散模型的各種圖片生成工具被開發(fā)出來。
在眾多模型中,Stable Diffusion 可謂是最出圈的一個,為其捐贈計算資源的英國開源人工智能公司 Stability AI 為此還獲得了 1.01 億美元融資,融資完成后,Stability AI 估值將達到 10 億美元。就在最近,還鬧出了 Stable Diffusion 背后團隊互撕的笑話,原因是他們都想當 Stable Diffusion 的所有者。
其實這個模型的技術來源是發(fā)表在 CVPR 2022 中的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分別來自慕尼黑大學、海德堡大學和 AI 視頻剪輯技術創(chuàng)業(yè)公司 Runway。

研究者對 Stable Diffusion 的開發(fā)一直在繼續(xù)。就在今日,reddit 上一則帖子點贊量已經(jīng)突破 800+。

大概意思就是:Stable Diffusion 背后團隊之一的 Runway 公司發(fā)布了一個由 Stable Diffusion 模型驅(qū)動的圖像擦除和替換(Erase and Replace)工具,該工具可以修改圖像任何部分。用戶需要做的就是擦除該區(qū)域并編寫自然語言描述,剩下的交給程序就可以了。
舉例來說,一開始樹葉上是一只七星瓢蟲,用戶擦出掉(如紫色區(qū)域)該動物,然后輸入自然語言描述「正在找食物的蜜蜂」,點擊「替換」按鈕就可以了。

土地里「長」出不同的植物:

站在柱子上的不同種類的鳥:

不同樣式的林中小屋:


看完上述展示,不禁有種修改一張圖,就一句話的事的感覺。
此外,Runway 還發(fā)布了「擦除和替換」功能背后的模型,感興趣的小伙伴可以在 GitHub 上查看。該公司計劃在未來推出更多 Stable Diffusion 檢查點,并在 Runway 的 HPC 集群上進行訓練。

GitHub 地址:https://github.com/runwayml/stable-diffusion#inpainting-with-stable-diffusion
項目首先通過 Huggingface 的 Diffusers 庫來使用修復模型。Diffusers 是在 PyTorch 中用于圖像和音頻生成的 SOTA 擴散模型,并作為擴散模型推理和訓練的模塊化工具箱。
相關代碼如下所示。

同時,為了評估修復模型的性能,項目使用了與論文《High-Resolution Image Synthesis with Latent Diffusion Models》中相同的評估協(xié)議。由于 Stable Diffusion 修復模型接受文本輸入,因而只使用一個固定提示,即「photograph of a beautiful empty scene, highest quality settings.」。
評估結(jié)果如下所示。

網(wǎng)友大開腦洞,生成創(chuàng)意圖片
這個「擦除和替換」工具大大激發(fā)了網(wǎng)友的創(chuàng)作興趣,各種獵奇的創(chuàng)意作品都整出來了,讓人不得不佩服腦洞之大。
有人使用它惡搞了前幾天宣布辭職的英國前首相莉茲 · 特拉斯。

Twitter@aifunhouse
還有人對荷蘭畫家約翰內(nèi)斯 · 維米爾的油畫《戴珍珠耳環(huán)的少女》進行了一系列「改寫」,有趣極了。

Twitter@Yining Shi
原文地址:http://www.myzaker.com/article/635560e88e9f096a9467564b
轉(zhuǎn)載請注明:Stable Diffusion新玩法,一句話幫你換圖,網(wǎng)友魔改《戴珍珠耳環(huán)的少女》長這樣 | 快導航網(wǎng)