在萬(wàn)物互聯(lián)的5G時(shí)代,媒體智能化已經(jīng)成為不可阻擋的趨勢(shì)和發(fā)展方向。人工智能技術(shù)與媒體如何融合?智能化會(huì)帶來(lái)哪些媒體倫理問(wèn)題?進(jìn)入智能時(shí)代,媒體如何做好社會(huì)的“瞭望者”?新浪新聞、封面新聞聯(lián)合推出《未來(lái)媒體訪談》節(jié)目智能媒體專題,探討與智能媒體相關(guān)的問(wèn)題。
童欣,現(xiàn)任微軟亞洲研究院首席研究員,網(wǎng)絡(luò)圖形組研究主管。童欣博士主要的研究方向?yàn)橛?jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)。他于1993年畢業(yè)于浙江大學(xué)計(jì)算機(jī)系,獲工學(xué)學(xué)士學(xué)位;1996年獲浙江大學(xué)計(jì)算機(jī)系碩士學(xué)位;1999年獲清華大學(xué)計(jì)算機(jī)系博士學(xué)位,同年加入微軟亞洲研究院。
以下為訪談實(shí)錄:
主持人:Hello大家好,這里是由新浪新聞封面新聞共同推出的未來(lái)媒體訪談節(jié)目,細(xì)致入微的表情變化,自然的肌膚紋理沒(méi)有一絲一毫的違和感。如果我不告訴您,您能看得出剛剛這幾位參與者其實(shí)他們不在一個(gè)辦公環(huán)境嗎?這就是由微軟亞洲研究院研究的其中項(xiàng)目之一——3D視頻會(huì)議系統(tǒng),今天我們也非常榮幸的邀請(qǐng)到了微軟亞洲研究院首席研究員童欣博士來(lái)給我們聊一聊,在線會(huì)議的未來(lái)——3D視頻會(huì)議系統(tǒng)。童老師好!
童欣:主持人好。
主持人:剛剛我們從小片里比較粗略的了解到了,3D視頻會(huì)議系統(tǒng)它到底這個(gè)作用是什么,那么我們這里有一個(gè)很尖銳的問(wèn)題了,在線視頻會(huì)議其實(shí)已經(jīng)不是一個(gè)新鮮的事物了,很多工作軟件都帶有在線視頻會(huì)議的系統(tǒng),那么我們想問(wèn)的是微軟的3D視頻會(huì)議系統(tǒng)和剛剛我提到的這些有什么樣的區(qū)別?
童欣:謝謝您,您問(wèn)了一個(gè)特別好的問(wèn)題,我想您看到的所有的視頻會(huì)議無(wú)處不在的事情,也告訴我們說(shuō),大家有很強(qiáng)的在遠(yuǎn)程不同的人之間進(jìn)行會(huì)議進(jìn)行溝通的需求。
那么我想大家看到目前的會(huì)議系統(tǒng)的時(shí)候,一方面它給大家提供了很多便利,但如果我們?nèi)ズ臀覀儍蓚€(gè)人或者多個(gè)人真正在同一個(gè)環(huán)境中,比如我們現(xiàn)在在一個(gè)房間中開(kāi)會(huì)的時(shí)候,大家還能看到一些區(qū)別,比如最簡(jiǎn)單的今天我們兩個(gè)人坐在這里,我們可以有很自然的眼神交流對(duì)吧?我可以看到你很真實(shí)的所有身體的動(dòng)作等等這些東西。
那么在多個(gè)人的交流環(huán)境中,大家如何切換話題,誰(shuí)應(yīng)該講話,在一個(gè)自然的環(huán)境中共同的環(huán)境中,我們都很容易做到。但大家如果想一想,在遠(yuǎn)程的會(huì)議系統(tǒng)中或者視頻會(huì)議系統(tǒng)中,目前都是非常難以做到的,那我們做這個(gè)3D會(huì)議系統(tǒng),我們最終想達(dá)到的一個(gè)目標(biāo)就是希望我們創(chuàng)建一個(gè)這樣的計(jì)算機(jī)環(huán)境,讓大家在做會(huì)議的時(shí)候,感覺(jué)自己就像在同一個(gè)環(huán)境中開(kāi)會(huì)一樣自然,同時(shí)為了達(dá)到這樣一個(gè)目標(biāo),我們也希望我們的設(shè)備足夠的簡(jiǎn)單,然后通過(guò)一套設(shè)備的設(shè)置能夠?qū)崿F(xiàn)不同的會(huì)議場(chǎng)景,比如像我們這樣的對(duì)談多人的會(huì)議,或者是大家一起工作的時(shí)候,我們叫做雙邊的一個(gè)大家一邊看著眼前的屏幕一邊交互的這樣一個(gè)場(chǎng)景。
主持人:您跟我解釋了以后我大概就明白了,比如說(shuō)我們電話會(huì)議是1.0版本,普通的在線視頻會(huì)議是2.0版本,那么微軟研究出來(lái)的3D在線視頻就是3.0版本,如果我們達(dá)到了3.0版本的話,這個(gè)門(mén)檻是不是很高?
童欣:
謝謝,我覺(jué)得可以叫做一個(gè)3.0版本,但同時(shí)就是說(shuō)要達(dá)到一個(gè)我們說(shuō)遠(yuǎn)程的非常逼真的體現(xiàn)這個(gè)人的所有的外觀動(dòng)作這樣一件事情,其實(shí)一直是計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)的一個(gè)挑戰(zhàn)。
為了做到這件事情,我們有三個(gè)需求,第一個(gè)需求叫我們講到的我們需要高保真,因?yàn)槲覀內(nèi)嗽谌粘I钪泻腿私换サ臅r(shí)候和人交流的時(shí)候,我們對(duì)人臉上的所有細(xì)微的表情,他的動(dòng)作什么是真什么是假,我們有非常高的嚴(yán)苛的標(biāo)準(zhǔn)在我們的意識(shí)里,這是第一件事情,所以我們要必須做到能夠再現(xiàn)他所有細(xì)微的表情動(dòng)作等等這些事情。
第二件事情我們講到了我們是一個(gè)實(shí)時(shí)會(huì)議系統(tǒng),所以所有的東西我們希望能夠達(dá)到實(shí)時(shí)的需求,所有的東西必須實(shí)時(shí)的呈現(xiàn)給對(duì)方,對(duì)方的反饋實(shí)時(shí)呈現(xiàn)給我,我們才能做很好的溝通,這是第二件事情。第三件事情我們講到了,為了實(shí)現(xiàn)這個(gè)目標(biāo),我們也希望我們所有的設(shè)備和捕捉手段足夠的便宜,足夠的方便,那么可以說(shuō)在三個(gè)需求要同時(shí)達(dá)到,一直是一件非常難的事情。
在過(guò)去幾十年的圖形學(xué)和視覺(jué)的研究中,大家研發(fā)了很多的技術(shù),比如說(shuō)我們?cè)谟耙晿I(yè)中,通過(guò)非實(shí)時(shí)的大量是手工的手段,我們已經(jīng)實(shí)現(xiàn)了可以說(shuō)和真人沒(méi)有差別的這樣一個(gè)繪制,對(duì)吧?但是它沒(méi)法實(shí)時(shí),在游戲中我們可以做到實(shí)時(shí),但是這個(gè)形象還達(dá)不到完全逼真對(duì)吧?在視覺(jué)中我們有一些捕捉手段,通過(guò)一些其他手段,我們可以捕捉非常逼真的人,甚至做到實(shí)時(shí),但是它的捕捉的整個(gè)設(shè)施是非常昂貴的,所以現(xiàn)在我們就需要有這些三個(gè)方面同時(shí)做了突破之后,我們才能實(shí)現(xiàn)現(xiàn)在的這樣一個(gè)會(huì)議的成績(jī)。
主持人:我曾經(jīng)在2012年看過(guò)一個(gè)報(bào)道,當(dāng)時(shí)微軟就說(shuō)我們已經(jīng)開(kāi)始開(kāi)發(fā)3D視頻會(huì)議的系統(tǒng),那么現(xiàn)在是2022年10年磨一劍,那么像您說(shuō)的基于當(dāng)時(shí)對(duì)于圖形圖像的研究,還沒(méi)有辦法實(shí)現(xiàn)這樣的一個(gè)設(shè)想,那么所以 VirtualCube是如何實(shí)現(xiàn)的?
童欣:就像您剛才講到的一樣,3D會(huì)議視頻系統(tǒng)實(shí)際上在視頻會(huì)議系統(tǒng)剛剛開(kāi)始的時(shí)候,不論是心理學(xué)家還是我們的計(jì)算機(jī)視覺(jué)計(jì)算機(jī)圖形學(xué)研究人員,就一直以此為目標(biāo),這也是微軟一直在這方面投入了很多的精力做研究,包括您看到的2012年的這個(gè)Viewport這個(gè)系統(tǒng),還有我們后來(lái)做的Holoportation都是朝著這個(gè)目標(biāo)前進(jìn)的,那么到現(xiàn)在為止,我們?yōu)榱俗霈F(xiàn)在這個(gè)系統(tǒng)我們和已有的系統(tǒng)有什么樣的突破呢?在我們的這種系統(tǒng)中,我們有兩個(gè)關(guān)鍵的技術(shù),我們把它叫做V-Cube Assembly就是組合和一個(gè)V-Cube View的算法,一個(gè)繪制的算法。
我們先來(lái)講第一件事情,我們剛才講到了說(shuō)我們希望每一個(gè)人在一個(gè)標(biāo)準(zhǔn)設(shè)置中,我們能夠?qū)崿F(xiàn)所有不同的會(huì)議場(chǎng)景,這里面一個(gè)關(guān)鍵技術(shù),我們意識(shí)到說(shuō)我們需要把每一個(gè)人他的所在的空間位置和一個(gè)虛擬環(huán)境的空間位置做到一個(gè)很好的映射,有了這個(gè)映射之后,我們就意識(shí)到我們可以把空間中不同地方的人通過(guò)拍攝的視頻三維視頻映射到一個(gè)共享的虛擬空間中,那么他們?cè)谔摂M空間中的互相的位置關(guān)系和我們真實(shí)我們想模擬的物理位置關(guān)系是完全一致的。
在這個(gè)情況下,我們通過(guò)不同的映射的改變,我們就可以實(shí)現(xiàn)不同的會(huì)議場(chǎng)景,這是一個(gè)關(guān)鍵技術(shù)。在這個(gè)關(guān)鍵技術(shù)下有了以后,那么可以想象到為了我們實(shí)現(xiàn)不同的會(huì)議者互相之間的溝通,我們就需要從不同的視角讓每一個(gè)人看這個(gè)人都非常的逼真。
這里我們實(shí)現(xiàn)需要一個(gè)叫3D View的技術(shù)。就是說(shuō)我要顯示這個(gè)視頻,能夠自由的切換我們的視點(diǎn),從各個(gè)視點(diǎn)看起來(lái)都是非常逼真的。在這個(gè)方面我們要研發(fā)的技術(shù),我們利用了傳統(tǒng)的一些算法的基礎(chǔ)思想,結(jié)合我們目前最先進(jìn)的計(jì)算機(jī)視覺(jué)的技術(shù),以及我們的深度學(xué)習(xí)的技術(shù)一起工作,那么實(shí)現(xiàn)了這樣一個(gè)實(shí)時(shí)的算法,和已有的算法相比,在保證實(shí)時(shí)的前提下,很大程度上提高了整個(gè)繪制質(zhì)量,那么實(shí)現(xiàn)了現(xiàn)在的效果。
主持人:在這10年計(jì)算機(jī)圖形學(xué)這個(gè)領(lǐng)域,它還有哪些研究發(fā)展幫助了這一設(shè)想的實(shí)現(xiàn)呢?
童欣:
我們可以說(shuō)在過(guò)去的幾年中,我們把進(jìn)展我們叫做一個(gè)智能圖形學(xué)的發(fā)展,什么意思?就是說(shuō)在傳統(tǒng)中我們已經(jīng)有了一些手段,這些手段通過(guò)我們的一些軟件,結(jié)合藝術(shù)家大量的手工工作,我們是可以產(chǎn)生高質(zhì)量?jī)?nèi)容的但在過(guò)去的幾年中我們也參與其中的,我把它叫做一個(gè)智能圖形學(xué)的研發(fā)的趨勢(shì),是說(shuō)我們結(jié)合現(xiàn)在大家在硬件上做的大量的設(shè)備,比如說(shuō)我們的普通的彩色攝像頭,我們的深度攝像頭這樣的設(shè)備,結(jié)合我們大量的已有的大量的高質(zhì)量的數(shù)據(jù),和我們的一些深度學(xué)習(xí)或者機(jī)器學(xué)習(xí)的算法一起工作,那么方便每一個(gè)普通的用戶能夠產(chǎn)生大量的高質(zhì)量的內(nèi)容,自動(dòng)的產(chǎn)生低成本的產(chǎn)生。
這些技術(shù)的發(fā)展實(shí)際上或多或少都對(duì)我們整個(gè)最后VirtualCube所用到的技術(shù)有所助益。
主持人:3D在線視頻會(huì)議系統(tǒng)除了讓我們有一種在線的交流感,有一種我們?cè)趫?chǎng)一對(duì)一交流的這種沉浸感,除了這樣的應(yīng)用還能應(yīng)用在哪些方面?
童欣:其實(shí)我覺(jué)得交流這個(gè)事情或者叫會(huì)議這個(gè)事情呢,實(shí)際上是一個(gè)無(wú)所不在的場(chǎng)景,如果大家有興趣的話,你用任何的搜索引擎在互聯(lián)網(wǎng)上去搜索會(huì)議的圖片,大家會(huì)發(fā)現(xiàn)一個(gè)非常有趣的現(xiàn)象,就是你會(huì)找到各種各樣的場(chǎng)景,遠(yuǎn)遠(yuǎn)超出你的想象,除了大家正襟危坐坐在會(huì)議室的場(chǎng)景,那么包括兩個(gè)人坐在屋子里一邊喝咖啡一邊聊天,它也是一種會(huì)議的場(chǎng)景。
所以我覺(jué)得可能對(duì)我們VirtualCube來(lái)講,一個(gè)最重要的應(yīng)用來(lái)說(shuō),就是提供給大家一個(gè)我們叫做泛在的或者無(wú)所不在的非常自然的一個(gè)互相溝通遠(yuǎn)程溝通的場(chǎng)景,這是我們的一個(gè)目標(biāo)。那么再往后面一步說(shuō),為了達(dá)到這個(gè)目標(biāo)所研發(fā)的技術(shù),比如我們的捕捉設(shè)備的技術(shù),包括我們繪制的技術(shù),我相信對(duì)其他的內(nèi)容生產(chǎn),比如說(shuō)我們的視頻產(chǎn)生,高質(zhì)量逼真的這個(gè)人,不論是用到影視中還是用在游戲中,我相信這個(gè)對(duì)他們都會(huì)有所助益,將來(lái)也都會(huì)推動(dòng)這些技術(shù)和這些應(yīng)用的發(fā)展。
主持人:我們通常說(shuō)一個(gè)設(shè)備被廣泛的應(yīng)用,甚至普及的一個(gè)前提就是說(shuō)成本的控制。那么我們剛剛講到3D視頻會(huì)議系統(tǒng),給我們帶來(lái)一對(duì)一的這種現(xiàn)場(chǎng)交流的沉浸感,達(dá)到這樣的效果,是不是它的成本是很昂貴的?
童欣:成本我們可以從兩方面說(shuō),一方面我們?cè)谠O(shè)計(jì)VirtualCube系統(tǒng)中,我們很注意到的一件事情,就是我們希望在達(dá)到效果的同時(shí),探索可能性的同時(shí),盡量的采用我們叫做一個(gè)商用的硬件,什么意思?這樣英文我們叫做off-the-shelf。所有這些硬件不是定制的,而是從市場(chǎng)上你就可以買到的。
所以在我們現(xiàn)在的VirtualCube的系統(tǒng)中,我們?cè)诓蹲椒矫嫖覀冇昧?個(gè)微軟的深度攝像頭,Azure Kinect攝像頭,然后同時(shí)我們?cè)谡麄€(gè)計(jì)算上,我們用了現(xiàn)在比較先進(jìn)的GPU來(lái)做這件事情。
那么我們從另一方面講,目前的所有這些設(shè)施,大家可以說(shuō)要用到馬上用到每個(gè)人的普通的環(huán)境中,還是相對(duì)來(lái)說(shuō)成本是較高的,但是它的好處是所有這些東西都是可以量產(chǎn)的,那么隨著硬件生產(chǎn)工藝的進(jìn)步,這個(gè)普及,那我相信這個(gè)成本呢會(huì)得到很大的下降,未來(lái)這條路通向說(shuō)每個(gè)人都能使用的,我覺(jué)得這條路是可以預(yù)見(jiàn)到的。
主持人:我們微軟的創(chuàng)始人比爾蓋茨先生曾經(jīng)公開(kāi)的表示,因?yàn)橐咔榈陌l(fā)展加上現(xiàn)在通信設(shè)備的發(fā)展,我們有可能以后會(huì)改變工作的模式,也許有一天我們都可以到元宇宙里去開(kāi)會(huì)了。我知道任何事物都有它的兩面性,有它的優(yōu)勢(shì)就有它的劣勢(shì)。那么我們3D視頻會(huì)議系統(tǒng)有什么局限性,也可以說(shuō)它的短板是什么?
童欣:你問(wèn)了一個(gè)特別好的問(wèn)題,也是一個(gè)可以是一個(gè)尖銳性的問(wèn)題。我們的理解是這樣的就是說(shuō)實(shí)際上包括像您剛才講的疫情也好,什么也好,或者大家的需求也好,會(huì)帶來(lái)一個(gè)虛擬辦公環(huán)境或者遠(yuǎn)程辦公的一個(gè)流行或者變得更加重要。
但是我們的理解其實(shí)它并不是一個(gè)替代的關(guān)系,換句話說(shuō)它并不會(huì)替代以前這種物理環(huán)境中大家的工作,因?yàn)檫€是在一個(gè)物理環(huán)境中,我們的人的很多的交流,他需要見(jiàn)到真實(shí)的人。它需要有這樣一個(gè)工作環(huán)境,它的很多便利我覺(jué)得是無(wú)可替代的。所以我們的理解是說(shuō)到最后實(shí)際上VirtualCube也好,還是其他技術(shù)也好,最終都是給大家提供了更多的可能性。那么還有一些環(huán)境中,比如說(shuō)我們開(kāi)著車的時(shí)候,這些環(huán)境中的時(shí)候,那么我們最后認(rèn)為我們最后會(huì)實(shí)現(xiàn)一個(gè)我們叫做混合辦公環(huán)境,就是說(shuō)所有的技術(shù)手段,我們給人提供所有的可能性,那么大家會(huì)根據(jù)自己所在的情境,選擇一個(gè)最有效的方法和別人做最有效的交流。
就像您剛才講到的目前的VirtualCube,我們專注的是提供一個(gè)高質(zhì)量的沉浸式的參與感很強(qiáng)的這樣體驗(yàn)。但為了實(shí)現(xiàn)這樣的一個(gè)體驗(yàn),你對(duì)設(shè)備你對(duì)這個(gè)環(huán)境可能就有一定的要求,那就像我剛才講到的,如果一個(gè)人在開(kāi)著車,怎么實(shí)現(xiàn)一樣的環(huán)境對(duì)吧?特別是我們現(xiàn)在需要一個(gè)很大的屏幕,如果你就是一個(gè)手機(jī),我可能講我們?cè)趺磁?可能都沒(méi)法實(shí)現(xiàn)一個(gè)沉浸式的眼神交流這樣一個(gè)體驗(yàn)。
這個(gè)是它的一個(gè)限制,但我覺(jué)得任何一個(gè)技術(shù)這樣的限制可能都是存在的,最終的目標(biāo)是說(shuō)如何把這些技術(shù)融合在一起,提供給一個(gè)大家,我們叫做無(wú)差別的或者具有包容性的解決方案來(lái)實(shí)現(xiàn)最有效的溝通,我覺(jué)得這可能是我們最終的一個(gè)目標(biāo)。
主持人:
無(wú)論是3D的視頻會(huì)議,還是這種各種跨界空間的交互辦公,可以看出來(lái)我們微軟一直在試圖打破這種真實(shí)和虛擬的技術(shù),再追求一個(gè)關(guān)鍵的元素,那就是沉浸感,我們不妨天馬行空的您幫我想一想,除了辦公方面的應(yīng)用,還有哪些這些智能媒體大顯身手的地方?
童欣:其實(shí)我覺(jué)得辦公是一個(gè)非常重要的事情,但是就像我們講的一個(gè)人生活我們可以分成兩部分,一部分是辦公,一部分是普通的生活。
比如說(shuō)我們兩個(gè)老人,他們生活在兩個(gè)城市中,由于各種各樣的原因,他們沒(méi)法互相去旅行了,那么我們也希望用這樣的一個(gè)系統(tǒng)給他們提供一個(gè)沉浸式的非常逼真的體驗(yàn)。我相信對(duì)他們個(gè)人的生活質(zhì)量的提高,幸福感的提高都是非常有用的。
那么同時(shí)這些技術(shù)的發(fā)展,大家可以看到在我們的日常的娛樂(lè)中,其他的媒體中包括新聞報(bào)道中。比如說(shuō)有一天也許我們真的可以用遠(yuǎn)程的方式你就可以采訪我,但可能我們沒(méi)辦法大家坐在一個(gè)屋子里,這樣我相信對(duì)其他的很多的應(yīng)用,很多的我們的媒體也好,或者對(duì)生活也好,都能起到很大的作用。
主持人:我們上面講到的這些三D視頻會(huì)議系統(tǒng)都是在一個(gè)顯示設(shè)備上呈現(xiàn)出來(lái)的,比如說(shuō)大屏幕,未來(lái)計(jì)算機(jī)圖形學(xué)能否結(jié)合虛擬和現(xiàn)實(shí)的技術(shù),將三D這個(gè)圖像直接投射在我們真實(shí)的生活里,而不僅僅是屏幕上。
童欣:對(duì),影響到這樣是跟顯示技術(shù)的發(fā)展相關(guān)的,那么可以說(shuō)顯示技術(shù),如果我們把按照顯示尺寸或者方式,我們可以分成兩種,一種就像我們現(xiàn)在用的大屏幕的這樣的東西,它更多的是尺寸比較大,大家的好處就是大家不需要戴任何的眼鏡。
還有另外一個(gè)大家知道最近大家研究非常熱的,我們叫做增強(qiáng)現(xiàn)實(shí)的技術(shù),那么微軟也有產(chǎn)品,比如我們的HoloLens這樣的一個(gè)產(chǎn)品,它通過(guò)大家戴一個(gè)眼鏡,可以把這個(gè)影像呈現(xiàn)在大家眼前,它的好處是隨著人的走動(dòng),這個(gè)影像可以跟著人去做各種移動(dòng)。
那么物理的屏幕的缺陷是你的位置比較固定,但是另外一方面你戴著眼鏡的缺陷是什么?是說(shuō)眼鏡帶著很不方便,還有很多的限制。那么其實(shí)即使在大屏幕的呈現(xiàn)中,大家有投影的技術(shù)或者其他的技術(shù)來(lái)做這些事情,我的理解就是最后這些技術(shù)可能都會(huì)并存,融合在一起,最后給大家提供一個(gè)無(wú)縫的虛擬和現(xiàn)實(shí)完全融合的這樣一個(gè)場(chǎng)景或者體驗(yàn)。
那就像我們現(xiàn)在新的一代人,可能他們使用iPad使用類似這樣電子產(chǎn)品已經(jīng)習(xí)以為常了,我的一個(gè)夢(mèng)想是也許過(guò)10年下一代人對(duì)他們來(lái)說(shuō)不太區(qū)分什么是現(xiàn)實(shí)的,什么是虛擬的,在他們來(lái)說(shuō)他們出生那一天起現(xiàn)實(shí)和虛擬就是很自然的結(jié)合在一起的,這是我們的一個(gè)愿景。
主持人:您剛剛提到的智能產(chǎn)品,我們就說(shuō)現(xiàn)在手機(jī)已經(jīng)是人所必備的一個(gè)智能的終端,未來(lái)能不能將上述我們提到的這些技術(shù)在手機(jī)上呈現(xiàn),比如說(shuō)我想跟朋友分享一個(gè)我剛買的一個(gè)小物件,我給他拍一張照片發(fā)給他,他就能隨意的拖拽360度的觀看物件。
童欣:這方面的技術(shù)其實(shí)我們微軟包括我們研究院,包括我們的小組在過(guò)去其實(shí)都有很多的研究,那么在最近一段時(shí)間大家可以看到我們叫做一個(gè)NERF或類似的這樣的捕捉的技術(shù),可以說(shuō)進(jìn)展非常的快,那么可以說(shuō)在目前我的感覺(jué)就是你可以看到已經(jīng)有一些比較成熟的或者說(shuō)比較好的應(yīng)用或者產(chǎn)品來(lái)幫大家做這些事情,就像您講的一樣,我通過(guò)捕捉一個(gè)360度的視頻,我就可以在里面很自然的實(shí)現(xiàn)一些拖拽,看一些物體這樣的東西。
但是在另一方面我們的技術(shù)發(fā)展目前還有一些限制,比如說(shuō)我雖然能看到這個(gè)物體了,可是我不好操作這個(gè)物體,當(dāng)我把這個(gè)物體放在我的家里的時(shí)候,我希望它的光照所有體現(xiàn)的效果跟我的家里完全一致,這些方面還有很多的技術(shù)有待于大家進(jìn)一步的提高,把它變得更魯棒(robust)變得更通用,但是另一方面我也相信這些技術(shù)很快就會(huì)得到成熟,大家很快就能把這些技術(shù)用到自己的實(shí)際生活中。
主持人:您認(rèn)為智能媒體和對(duì)其起到支撐幫助作用的圖形學(xué)未來(lái)的發(fā)展趨勢(shì)是什么?
童欣:
那么從我們角度來(lái)看,我覺(jué)得未來(lái)的圖形的發(fā)展,我們把它總結(jié)為幾個(gè)趨勢(shì),第一個(gè)趨勢(shì)我把它叫做智能化,智能化什么意思?在過(guò)去的二三十年的圖形學(xué)的發(fā)展中,我們?nèi)绻腿祟愖鲆粋€(gè)類比的話,我說(shuō)我們終于實(shí)現(xiàn)了農(nóng)業(yè)時(shí)代,什么意思?我們發(fā)明了鋤頭,我們發(fā)明了鐮刀,那么藝術(shù)家通過(guò)學(xué)會(huì)怎么用鋤頭鐮刀終于能把糧食種出來(lái)了,但是普通的人你是種不出來(lái)的,那么我們認(rèn)為智能提供了什么,我們通過(guò)一些人工智能的技術(shù),我們可以說(shuō)實(shí)現(xiàn)了一個(gè)機(jī)械化,那么我們讓普通的人也能通過(guò)一些智能的技術(shù),通過(guò)簡(jiǎn)單的交互就能把他心目中想的東西創(chuàng)作出來(lái),包括您說(shuō)的看到的東西能夠數(shù)字化成一個(gè)三維的模型帶到計(jì)算機(jī)里,這個(gè)趨勢(shì)我覺(jué)得是非常明顯的。在未來(lái)幾年中大家能看到很多技術(shù)的突破,甚至一些實(shí)用的應(yīng)用產(chǎn)生,我們把它叫做智能化。
第二項(xiàng)我們把它叫做綜合化或者叫集成化。什么意思?就是說(shuō)你去看很多的東西,除了我們做游戲等等這樣一個(gè)三維的形體,它其實(shí)不光光有它的三維的幾何或者外觀存在。我們?cè)谟螒蛑形覀円退换?我們每個(gè)人這樣交互,比如說(shuō)剛才您講到說(shuō)我掃描了一個(gè)物體,我要各個(gè)(角度)看,但是對(duì)大家來(lái)講,我買一個(gè)東西除了看我們還有別的需求,比如我想摸一摸它的質(zhì)感是怎么樣的,對(duì)吧?我想和它操作一下對(duì)吧?但說(shuō)明每一個(gè)物體除了它的幾何外觀,還有很多的屬性,比如說(shuō)它的物理學(xué)的屬性,它的材質(zhì)是什么樣的,甚至我想知道它的溫度是暖的還是冷的,對(duì)吧?
所以這些屬性其實(shí)在圖形學(xué)或者其他的學(xué)科中,目前都是被單獨(dú)處理的,每一個(gè)學(xué)科每一個(gè)領(lǐng)域只負(fù)責(zé)其中一小塊,那么最后如果你想得到一個(gè)統(tǒng)一的計(jì)算的表達(dá),滿足所有的需求,那就需要這些學(xué)科人坐在一起。那么同時(shí)通過(guò)各種技術(shù)的集成,包括打通各個(gè)領(lǐng)域的東西,真正提供一個(gè)我們叫做一個(gè)物體的全表達(dá),就是它既有,它的幾何屬性、物理屬性、材質(zhì)屬性、各種屬性坐在一起,這個(gè)物體就真正可以做到我們?cè)谒锩婵梢宰龈鞣N操作了。我把它叫做集成化或綜合化。
那么人工智能的技術(shù)其實(shí)對(duì)綜合化也會(huì)推動(dòng)它的發(fā)展,因?yàn)樗鼈兊娜斯ぶ悄芗夹g(shù)大家可以看到deep learning(深度學(xué)習(xí))的技術(shù),它提供了一種跨領(lǐng)域的方法論的統(tǒng)一的能力,那么最后一個(gè)我們可以叫做泛帶化或者叫做平民化。當(dāng)這樣兩個(gè)技術(shù)都有了以后,那么你可以看到以前的時(shí)候圖形的技術(shù)還有什么的技術(shù),大家覺(jué)得是非常離我非常遠(yuǎn)對(duì)吧?只有專業(yè)的人拿到了,然后創(chuàng)造一些電影游戲,我們只是消費(fèi)者,我們從來(lái)不會(huì)去創(chuàng)作圖形內(nèi)容。
我們希望以后什么呢,我們以后希望就是說(shuō)每一個(gè)無(wú)論是我們的個(gè)人想創(chuàng)作他腦海里想象的東西,還是我們的一個(gè)企業(yè),他想用一些圖形學(xué)的技術(shù)來(lái)模擬真實(shí)的世界來(lái)做一些預(yù)測(cè)規(guī)劃的時(shí)候,這些圖形的東西就能變成我們的水電一樣的一個(gè)資源或者一種服務(wù)無(wú)所不在,每個(gè)人都可以經(jīng)過(guò)簡(jiǎn)單的學(xué)習(xí)就能使用,能得到服務(wù)的反饋,能夠在他日常的生活和他的所有的工業(yè)的應(yīng)用中無(wú)所不在的起到它的作用,這是我們對(duì)未來(lái)的一個(gè)期望或者我們的一個(gè)愿景。
欄目制片人:智惠群
本期嘉賓:童欣 微軟亞洲研究院首席研究員
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
Copyright 2015-2022 安卓網(wǎng)版權(quán)所有 備案號(hào):豫ICP備2021032478號(hào)-23 聯(lián)系郵箱:89 718 09@qq.com