- +1
照片隨便拍,光影任意調(diào),MIT谷歌新研究器材黨看了會(huì)沉默
金磊 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
在攝影這件事上,「光影」簡直不要太重要。
畢竟大師們攝影作品,大多都是對「光」和「影」的拿捏。

而最近,MIT 和谷歌等機(jī)構(gòu)聯(lián)手提出了一種用神經(jīng)網(wǎng)絡(luò)「打光」的新方法,大大降低了對「光影」拿捏的門檻——神經(jīng)光線傳輸 (Nerual Light Transport,NLT)。
例如下圖所示,只要拍好人物照片,無論背景如何轉(zhuǎn)換,都可以相應(yīng)的調(diào)節(jié)人物身上的「光影」。



言歸正傳,繼續(xù)聊聊 NLT 這項(xiàng)技術(shù)。
NLT——拿捏光線的一把好手
光線傳輸(LT)可以描述一個(gè)場景中,物體在不同光照和方向下所呈現(xiàn)出來的樣子。
而完整地了解一個(gè)場景的 LT,還可以實(shí)現(xiàn)任意光照下的新視圖合成。
于是,MIT 和谷歌的研究人員基于圖像 LT 采集(以人體為主),提出了一種半?yún)?shù)的深度學(xué)習(xí)框架,來學(xué)習(xí) LT 的神經(jīng)表示,名曰NLT。
總體而言,NLT 可以單獨(dú)或同時(shí)完成以下兩項(xiàng)任務(wù):
用定向光或HDRI圖,重新照亮場景的光線真實(shí)性。
合成具有視圖依賴性效果的新視圖。
來看下 NLT 在不同任務(wù)下的效果。
首先是「定向重打光」 (Directional Relighting)。

接下來,是基于「背景圖的重打光」 (Image-Based Relighting)。

最后,是「視圖合成+同步光源」 (View Synthesis & Simultaneous)。

例如,在「重打光」(Redlighting)任務(wù)中,與其它基線方法相比,在 PSNR 和 SSIM 兩個(gè)指標(biāo)中都取得了最先進(jìn)的結(jié)果。


NLT模型:「查詢」、「觀測」兩步走
NLT 的模型網(wǎng)絡(luò)主要由2條路徑構(gòu)成,分別是查詢路徑 (Query Path)和觀測路徑 (Observation Path)。


這條路徑將所需的光線和觀察方向,以及物理上精確的 disue base 作為輸入。

最后,通過將深度神經(jīng)網(wǎng)絡(luò)嵌入到UV紋理空間中,便可以合成與可見光線和觀看角度對應(yīng)的紋理空間RGB圖像。
華人小哥一作
這項(xiàng)研究的第一作者,是來自MIT的博士生,張修明。

另一位主要作者是Sean Fanello。

研究興趣主要包括數(shù)字人類、體積重建、高質(zhì)量的深度傳感和非剛性跟蹤。
最后,項(xiàng)目將在近日開源,感興趣的朋友持續(xù)關(guān)注下方參考鏈接中的信息更新。
參考鏈接:
http://nlt.csail.mit.edu/
— 完 —
本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵(lì)計(jì)劃簽約賬號【量子位】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。
原標(biāo)題:《照片你隨便拍,「光影」我任意調(diào),MIT谷歌新研究,器材黨老法師看了會(huì)沉默》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




