發(fā)布時(shí)間:2021-06-30 來源:蓋世汽車
據(jù)外媒報(bào)道,哥倫比亞大學(xué)工程學(xué)院的研究人員推出一種計(jì)算機(jī)視覺技術(shù),通過利用人、動(dòng)物和物體之間的高層次關(guān)聯(lián),讓機(jī)器對(duì)接下來會(huì)發(fā)生的事情有更直觀的感知。
哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)助理教授Carl Vondrick表示:“我們的算法使機(jī)器能夠?qū)θ祟愋袨樽龀龈玫念A(yù)測(cè),從而更好地協(xié)調(diào)機(jī)器與我們的行為。此項(xiàng)研究結(jié)果為人機(jī)協(xié)作、自動(dòng)駕駛汽車和輔助技術(shù)開辟了更多可能性?!?/p>
研究人員稱,該算法是迄今為止,對(duì)視頻內(nèi)未來幾分鐘的動(dòng)作事件預(yù)測(cè)的最準(zhǔn)確的方法。在分析了數(shù)千小時(shí)的電影、體育比賽和“辦公室(The Office)”等節(jié)目后,該系統(tǒng)學(xué)會(huì)了預(yù)測(cè)上百種活動(dòng),從握手到碰拳。而當(dāng)系統(tǒng)無法預(yù)測(cè)具體的動(dòng)作時(shí),就會(huì)找到將動(dòng)作聯(lián)系起來的更高級(jí)別的概念,即“問候(greeting)”。
(圖片來源:哥倫比亞大學(xué))
過去在預(yù)測(cè)機(jī)器學(xué)習(xí)方面的嘗試,包括團(tuán)隊(duì)嘗試,都是一次只預(yù)測(cè)一個(gè)動(dòng)作。算法決定是否將動(dòng)作歸類為擁抱、擊掌、握手,甚至是“忽略”等非動(dòng)作。但當(dāng)不確定性很高時(shí),大多數(shù)機(jī)器學(xué)習(xí)模型都無法找到可能選項(xiàng)間的共性。
哥倫比亞大學(xué)工程學(xué)院博士學(xué)生Didac Suris和Ruoshi Liu決定從不同的角度來看待更長(zhǎng)期的預(yù)測(cè)問題。Suris稱:“未來的一切并非都是可以預(yù)測(cè)的。當(dāng)一個(gè)人無法準(zhǔn)確預(yù)見會(huì)發(fā)生什么時(shí),他們會(huì)謹(jǐn)慎行事并在更高的抽象層次上進(jìn)行預(yù)測(cè)。我們的算法是第一個(gè)學(xué)習(xí)抽象推理未來事件能力的算法?!?/p>
因此,Suris和Liu重新研究古希臘數(shù)學(xué)問題。在高中,學(xué)生會(huì)學(xué)習(xí)熟悉且直觀的幾何原則:直線是筆直的,平行線永遠(yuǎn)不會(huì)交叉。而大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)也遵守這些原則。但是,其他幾何圖形具有奇異的、違反直覺的特性,如直線彎曲和三角形凸出。Suris和Liu使用這些不尋常的幾何結(jié)構(gòu)來構(gòu)建AI模型,從而組織高級(jí)概念并預(yù)測(cè)未來的人類行為。
麻省理工學(xué)院(MIT)高級(jí)研究科學(xué)家、MIT -IBM沃森人工智能實(shí)驗(yàn)室(Watson AI Lab)聯(lián)合主任Aude Oliva表示:“預(yù)測(cè)是人類智能的基礎(chǔ)。人類永遠(yuǎn)不會(huì)犯的錯(cuò)誤,機(jī)器會(huì)犯,因?yàn)樗鼈內(nèi)狈ξ覀兂橄笸评淼哪芰?。而這項(xiàng)工作是彌合這一技術(shù)差距的關(guān)鍵一步?!?/p>
研究人員開發(fā)的數(shù)學(xué)框架可以使機(jī)器能夠根據(jù)事件在未來的可預(yù)測(cè)性組織事件。 例如,我們知道游泳和跑步都是鍛煉的形式。而該新技術(shù)可學(xué)習(xí)如何自行對(duì)這些活動(dòng)進(jìn)行分類。系統(tǒng)可以識(shí)別不確定性,在確定時(shí)提供更具體的操作,并在不確定時(shí)提供更通用的預(yù)測(cè)。
研究人員說,這項(xiàng)技術(shù)可以讓計(jì)算機(jī)更接近于評(píng)估環(huán)境并做出細(xì)微決定,而非預(yù)先編程的動(dòng)作。該論文的共同主要作者Liu稱:“這是在人與計(jì)算機(jī)之間建立信任的關(guān)鍵一步。信任來自機(jī)器人真正了解人的感覺,如果機(jī)器能夠理解和預(yù)測(cè)我們的行為,計(jì)算機(jī)將能夠無縫地協(xié)助人們進(jìn)行日常活動(dòng)。”
Vondrick說:“與之前相比,雖然新算法對(duì)基準(zhǔn)任務(wù)的預(yù)測(cè)更準(zhǔn)確,但接下來的步驟將驗(yàn)證該算法在實(shí)驗(yàn)室外是否有效。”研究人員說:“如果該系統(tǒng)可以在不同的環(huán)境中工作,那么就很有可能部署機(jī)器和機(jī)器人,從而改善我們的安全、健康和保障。”該小組計(jì)劃繼續(xù)使用更大的數(shù)據(jù)集和計(jì)算機(jī)以及其他形式的幾何來提高算法的性能。Vondrick評(píng)論道:“人類的行為常常出乎意料。而我們的算法可以使機(jī)器能夠更好地預(yù)測(cè)他們接下來要做什么。”