一張隨便勾畫(huà)的草圖,居然也可以分分鐘自動(dòng)變成逼真的 3D 模型?!


360 ° 無(wú)死角不說(shuō),轉(zhuǎn)換期間真的不需要任何其它角度姿勢(shì)的輸入。
這就是獲得了SIGGRAPH 2022 榮譽(yù)獎(jiǎng)的一個(gè)最新 3D 姿態(tài)估計(jì)模型:
Sketch2Pose。
除了草圖,像這樣的小猴子,四肢嚴(yán)重不按比例生長(zhǎng),Sketch2Pose 也可以辦到:

這是如何做到的?
只要 4 步,草圖人變 3D 人
將草圖上的人物 / 形象變成 3D 模型,此前的研究中都還未專門涉及。
該任務(wù)最大的挑戰(zhàn)就是比例失真問(wèn)題,因?yàn)楫?huà)上的東西可能頭大身子小、胳膊長(zhǎng)腿短……
為此,Sketch2Pose 通過(guò)對(duì)三個(gè)關(guān)鍵元素進(jìn)行預(yù)測(cè)來(lái)消除繪制姿勢(shì)時(shí)的可能出現(xiàn)的 " 歧義 "。
這三個(gè)元素分別是:
2D 骨骼切線(2D bone tangents)
自接觸區(qū)域(self-contacts)
骨骼縮短比例(bone foreshortening)
其中,2D 骨骼切線(下圖藍(lán)色部分)是預(yù)測(cè) 3D 骨骼方向最有力的指標(biāo)(關(guān)節(jié)位置不行)。
自接觸區(qū)域(如下圖綠色部分,手接觸腰的位置)對(duì)于理解 3D 姿勢(shì)至關(guān)重要,也是消除未知身體部位歧義的線索。
骨骼縮短轉(zhuǎn)換系統(tǒng)則利用統(tǒng)計(jì)分析來(lái)糾正原圖中的比例問(wèn)題。

根據(jù)這三者預(yù)測(cè),再使用最先進(jìn)的優(yōu)化框架(optimization framework),并用專門設(shè)計(jì)的一種新的損失(loss)來(lái)平衡姿勢(shì)自然度,以及與輸入草圖的相似性,AI 就能最終推斷出符合畫(huà)者意向的 3D 姿勢(shì)。
具體步驟如下:
輸入一張草圖,首先預(yù)測(cè)出 2D 關(guān)節(jié)位置或骨架,用于 3D 人體模型的粗略對(duì)齊。
然后預(yù)測(cè)屏幕空間(screen-space)接觸區(qū)域,將其映射到粗略對(duì)齊的 3D 模型上,得到一組接觸頂點(diǎn)(紅色部分)。
接著,利用縮短轉(zhuǎn)換階段描述的草圖人物比例問(wèn)題,進(jìn)行修補(bǔ)。
最后,在優(yōu)化框架中利用 2D 骨架的骨骼切線、粗略對(duì)齊的 3D 姿勢(shì)以及比例修補(bǔ),產(chǎn)生最終結(jié)果。

有遮擋缺失也 OK
最終的 Sketch2Pose 可以支持多種草圖風(fēng)格的轉(zhuǎn)換,比如下圖中的簡(jiǎn)筆畫(huà)或者水墨畫(huà),像下下圖最后一張那樣簡(jiǎn)略的也可以。

同時(shí),對(duì)缺失、遮擋部位也能穩(wěn)健處理。
比如上圖第一行中的人手(不過(guò)我們發(fā)現(xiàn)左邊的似乎推測(cè)有錯(cuò),手應(yīng)該是放在兩腿之間;右邊的抱頭基本沒(méi)啥問(wèn)題,但手掌應(yīng)該向后彎曲)。
再將 Sketch2Pose 和 SOTA 方法進(jìn)行比較,結(jié)果還是令人非常滿意的。
可以看到,Sketch2Pose(第三列)對(duì)姿勢(shì)還原的更到位,缺失部分的預(yù)測(cè)也更符合人體構(gòu)造。

而開(kāi)頭那只小猴子,M ü ller et al. 2021 等方法的轉(zhuǎn)換效果就是下面這樣:

對(duì)于猴子 " 扭曲 " 的下肢部分,這些方法都出現(xiàn)了理解偏差—— Sketch2Pose 完勝。
作者介紹
Sketch2Pose 一共有兩位作者,都來(lái)自加拿大蒙特利爾大學(xué)。
一作名叫 Kirill Brodt ( Кирилл Бродт ) ,出生于 1991 年,本碩畢業(yè)于新西伯利亞州立大學(xué)(數(shù)學(xué)學(xué)位),后在 Yandex 數(shù)據(jù)分析和計(jì)算機(jī)科學(xué)中心學(xué)院學(xué)習(xí)機(jī)器學(xué)習(xí),現(xiàn)為蒙特利爾大學(xué)的一位博士生。
他的主要研究方向?yàn)楦輬D有關(guān)的計(jì)算機(jī)視覺(jué)轉(zhuǎn)換。
另一位作者名叫 Mikhail Bessmeltsev,是一作的導(dǎo)師,蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)籌學(xué)系的助理教授。

感興趣的同學(xué)可以戳論文原文,或者去 Huggingface 上試試效果。
原文地址:http://www.myzaker.com/article/63031f668e9f093f3170cacc
轉(zhuǎn)載請(qǐng)注明:草圖人像變3D模特,360° 無(wú)死角還原姿勢(shì),一張就行,多“草”都可 | 快導(dǎo)航網(wǎng)