
另一種功能。
AI 作畫又有了新的風向。
最近,來自慕尼黑大學的研究者與多方機構合作,共同推出了一款名為 "Stable Diffusion" 的文本轉圖像模型,能夠在消費級 CPU 上運行,且圖片無需任何預處理。目前該模型代碼已經開源,任何人都可自行下載并運行這個程序。

一幅由 Stable Diffusion 自動生成的圖片
只需等待數秒鐘,程序便可根據給出的文本自動生成圖片,且允許免費商用。由于開源、生成時間短、圖片精美等原因,讓 Stable Diffusion 連同 AI 作畫再次成為了網友們熱議的話題。
而除了使用最廣也最流行的 " 文本作畫 " 功能外,不少人也開始在這個程序中開發更多的新玩法。
比如一位 ID 為 "frigis9" 的用戶就在國外論壇上發布了一則關于 " 像素高清化 " 的帖子,介紹了他是如何通過 AI 技術將過去經典的像素游戲畫面轉變為高清圖畫的。


他選用的素材是曾在 MS-DOS 平臺上非常經典的《基恩指揮官 6》與《猴島小英雄》,通過 AI 的處理后,可以看到原本較為粗糙且清晰度不高的游戲畫面被渲染成了高清且更加真實的圖片。
實現這樣的效果,依靠的是模型中一種名為 "img2img"(圖像到圖像)的功能,和常見的 AI 作畫不同,除了文本以外,它還允許用戶提前給定一幅圖片,系統最終會根據用戶文本,在已有圖片的基礎上生成新的畫面。
除了前面提到的兩款經典 DOS 游戲外,frigis9 還發布了通過 AI 升級后的多幅像素圖畫,比如來自《星球大戰:黑暗原力》的角色凱爾 · 卡塔恩,原有的像素畫面在經過 AI 處理后,變成了更接近真人的圖片:

不過雖然看上去非常智能,但為了能夠讓 AI 準確地還原畫面,這項技術目前依舊需要人工的干預。frigis9 就在帖子中坦白為了得到觀感更好的圖片,他需要在軟件中調整多方面參數,并且不斷更換關鍵詞的描述,前后經過了近百次的微調,才最終得出了理想的還原圖。
就拿《基恩指揮官》的像素圖片來說,如果你只是簡單在文本框中輸入 "a helmet holding a laser gun"(帶頭盔的人拿著一把激光槍)而沒有做更多微調和細節描述,那么最終生成的圖片很可能讓人哭笑不得:
原文地址:http://www.myzaker.com/article/63161c73b15ec02e6c591598