欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

前沿科技 3年前 (2022) 虛像

2 0 0

給 Imagen 加上 " 指哪打哪 " 的能力，會變得有多強(qiáng)？

只需上傳 3-5 張指定物體的照片，再用文字描述想要生成的背景、動(dòng)作或表情，就能讓指定物體 " 閃現(xiàn) " 到你想要的場景中，動(dòng)作表情也都栩栩如生。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

不止是動(dòng)物，其他物體像墨鏡、書包、花瓶，也都能做出幾乎以假亂真的成品：

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

屬于是發(fā)朋友圈也不會被別人看出破綻的那種。（手動(dòng)狗頭）

這個(gè)神奇的文字 - 圖像生成模型名叫 DreamBooth，是谷歌的最新研究成果，基于 Imagen 的基礎(chǔ)上進(jìn)行了調(diào)整，一經(jīng)發(fā)布就在推特上引發(fā)熱議。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

有網(wǎng)友調(diào)侃：這簡直是最先進(jìn)的梗圖生成器。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

目前相關(guān)研究論文已上傳至 arXiv。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

幾張照片就能 " 環(huán)游世界 "

在介紹原理前，讓我們先來看看 DreamBooth 的各種能力，包括換景、指定動(dòng)作表情服飾、更迭風(fēng)格等。

如果你是個(gè) " 鏟屎官 "，有了這個(gè)模型的 "換景能力"，就能足不出戶送自家狗子走出家門，凡爾賽宮里、富士山腳下……通通不在話下。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

△光照也比較自然

不僅如此，寵物的動(dòng)作和表情也都能隨意指定，屬實(shí)是把 " 一句話 P 圖 " 的細(xì)節(jié)拿捏到位了。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

除了上面的 " 基操 " 以外，DreamBooth 甚至還能更換各種照片風(fēng)格，也就是所謂的 " 加濾鏡 "。

例如，各種 " 世界名畫 " 畫風(fēng)、各種視角的狗子，簡直不要太藝術(shù)：

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

至于給它們加上裝飾？各種 cosplay 的小道具，也是小菜一碟。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

除此之外，無論是更換顏色：

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

還是更魔幻一點(diǎn)，更換物種，這只 AI 也都能做到。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

那么，如此有趣的效果背后的原理是什么呢？

給輸入加個(gè) " 特殊標(biāo)識符 "

研究人員做了個(gè)對比，相較于其他大規(guī)模文本 - 圖像模型如 DALL-E2、Imagen 等，只有采用 DreamBooth 的方法，才能做到對輸入圖像的忠實(shí)還原。

如下圖所示，輸入 3 張右邊表盤上畫著黃色 "3" 的小鬧表，其中 DreamBooth 生成的圖像完美保留了鐘表的所有細(xì)節(jié)，但 DALL-E2 和 Imagen 幾次生成的鐘都與原來的鐘 " 有那么點(diǎn)差異 "。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

△李逵和 " 李鬼 "

而這也正是 DreamBooth 最大的特點(diǎn)——個(gè)性化表達(dá)。

用戶可以給定 3-5 張自己隨意拍攝的某一物體的圖片，就能得到不同背景下的該物體的新穎再現(xiàn)，同時(shí)又保留了其關(guān)鍵特征。

當(dāng)然，作者也表示，這種方法并不局限于某個(gè)模型，如果 DALL · E2 經(jīng)過一些調(diào)整，同樣能實(shí)現(xiàn)這樣的功能。

具體到方法上，DreamBooth 采用了給物體加上 "特殊標(biāo)識符" 的方法。

也就是說，原本圖像生成模型收到的指令只是一類物體，例如 [ cat ] 、 [ dog ] 等，但現(xiàn)在 DreamBooth 會在這類物體前加上一個(gè)特殊標(biāo)識符，變成 [ V ] [ 物體類別 ] 。

以下圖為例，將用戶上傳的三張狗子照片和相應(yīng)的類名（如 " 狗 "）作為輸入信息，得到一個(gè)經(jīng)過微調(diào)的文本 - 圖像擴(kuò)散模型。

該擴(kuò)散模型用 "a [ V ] dog" 來特指用戶上傳圖片中的狗子，再把其帶入文字描述中，生成特定的圖像，其中 [ V ] 就是那個(gè)特殊標(biāo)識符。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

至于為什么不直接用 [ V ] 來指代整個(gè) [ 特定物體 ] ？

作者表示，受限于輸入照片的數(shù)量，模型無法很好地學(xué)習(xí)到照片中物體的整體特征，反而可能出現(xiàn)過擬合。

因此這里采用了微調(diào)的思路，整體上仍然基于 AI 已經(jīng)學(xué)到的 [ 物體類別 ] 特征，再用 [ V ] 學(xué)到的特殊特征來修飾它。

以生成一只白色的狗為例，這里模型會通過 [ V ] 來學(xué)習(xí)狗的顏色（白色）、體型等個(gè)性化細(xì)節(jié)，加上模型在 [ 狗 ] 這個(gè)大的類別中學(xué)到的狗的共性，就能生成更多合理又不失個(gè)性的白狗的照片。

為了訓(xùn)練這個(gè)微調(diào)的文本 - 圖像擴(kuò)散模型，研究人員首先根據(jù)給定的文本描述生成低分辨率圖像，這時(shí)生成的圖像中狗子的形象是隨機(jī)的。

然后再應(yīng)用超分辨率的擴(kuò)散模型進(jìn)行替換，把隨機(jī)圖像換成用戶上傳的特定狗子。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

研究團(tuán)隊(duì)

DreamBooth 的研究團(tuán)隊(duì)來自谷歌，第一作者是 Nataniel Ruiz。

Nataniel Ruiz 是波士頓大學(xué)圖像和視頻計(jì)算組的四年級博士生，目前在谷歌實(shí)習(xí)。主要研究方向是生成模型、圖像翻譯、對抗性攻擊、面部分析和模擬。

谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換

原文地址：http://www.myzaker.com/article/630a38e58e9f0922495a1078

ai 書包分辨率服飾谷歌

版權(quán)聲明：虛像發(fā)表于 2022年8月28日 am1:43。
轉(zhuǎn)載請注明：谷歌用新AI超越自己：讓Imagen能夠指定生成對象，風(fēng)格還能隨意轉(zhuǎn)換 | 快導(dǎo)航網(wǎng)

相關(guān)文章

站在前方,為你導(dǎo)航！

Copyright ? 2025 快導(dǎo)航網(wǎng) 蜀ICP備2022003117號-2

川公網(wǎng)安備51012402001058號
注意：本站僅收錄網(wǎng)站，不對其網(wǎng)站內(nèi)容或交易負(fù)責(zé)。若收錄的站點(diǎn)侵害到您的利益，請聯(lián)系我們刪除收錄。郵箱： admin@hifast.cn

主站蜘蛛池模板：托里县| 霍邱县| 敦化市| 镇康县| 清涧县| 昌图县| 灵武市| 太谷县| 浏阳市| 泊头市| 清流县| 尉氏县| 新乐市| 凤冈县| 云龙县| 巴彦淖尔市| 互助| 库伦旗| 留坝县| 达孜县| 壤塘县| 荔浦县| 城口县| 车险| 汉沽区| 都昌县| 北票市| 台中县| 鄂托克前旗| 渝北区| 汉中市| 依兰县| 西林县| 额敏县| 靖西县| 于都县| 德昌县| 资中县| 永修县| 西峡县| 崇礼县|