Facebook研究機(jī)器人,是打的什么算盤?
這對(duì)Facebook有什么用呢?
Facebook在計(jì)算機(jī)視覺方面一直走在前列,正如我們?cè)谒南鄼C(jī)和圖像處理程序以及Portal等設(shè)備上看到的那樣,Potal會(huì)用它的“臉”跟著用戶在房間里轉(zhuǎn)來轉(zhuǎn)去。
雖然聽上去有些驚悚,但是好奇心對(duì)于這些需要了解他們所看到或感覺到的環(huán)境才能正常工作的應(yīng)用程序來說都是至關(guān)重要的。
任何在應(yīng)用程序或設(shè)備上運(yùn)行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當(dāng)一張臉進(jìn)入畫面時(shí),十幾個(gè)新的算法就會(huì)同時(shí)啟動(dòng)并開始工作。如果有人舉起一個(gè)物體,攝像頭就會(huì)忙著分析:它有文字內(nèi)容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠(yuǎn)?
如果設(shè)備要及時(shí)完成這些任務(wù),就會(huì)產(chǎn)生CPU使用率峰值、可見延遲以及用戶或系統(tǒng)工程師不希望出現(xiàn)的種種情況。
相反,如果人工智能助理在對(duì)場(chǎng)景感到不確定性時(shí),發(fā)揮它的好奇心去檢查這些東西,確定分析物體的優(yōu)先級(jí),是個(gè)相當(dāng)不錯(cuò)的折衷辦法。
通過觸摸感知
盡管視覺很重要,但它不是我們或機(jī)器人感知世界的唯一方式。許多機(jī)器人都配備了運(yùn)動(dòng)、聲音和其他形式的傳感器,但對(duì)物體的實(shí)際接觸相對(duì)較少。我們可以把它歸因于缺乏良好的觸覺接口。
盡管如此,F(xiàn)acebook的研究人員還是想研究使用觸覺數(shù)據(jù)代替視覺數(shù)據(jù)的可能性。
仔細(xì)想想,這完全是正常的,就像有視覺障礙的人用觸覺來了解周圍的環(huán)境,獲取關(guān)于物體的細(xì)節(jié)。
因此,F(xiàn)acebook的研究人員部署了一個(gè)人工智能模型,機(jī)器人根據(jù)視頻來決定采取什么行動(dòng),但不是實(shí)際的視頻數(shù)據(jù),而是給它輸入高分辨率的觸摸數(shù)據(jù)。
結(jié)果表明,該算法并不真正關(guān)心它是否像我們平時(shí)觀察世界的圖像,只要數(shù)據(jù)是以視覺方式呈現(xiàn)的,例如作為觸覺傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對(duì)Facebook有什么用呢?
雖然Facebook對(duì)用戶接觸并沒有多大興趣。但這不僅僅是接觸的問題,而是跨模式應(yīng)用學(xué)習(xí)。
試想你第一次看到兩個(gè)不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來。為什么會(huì)這樣?
因?yàn)楫?dāng)你看到某個(gè)東西時(shí),你不只是觀察到它的樣子,還構(gòu)想了一個(gè)內(nèi)部模型來表示它,包含了多種感官和視角。
類似地,人工智能助理可能需要將其學(xué)習(xí)的內(nèi)容從一個(gè)領(lǐng)域轉(zhuǎn)移到另一個(gè)領(lǐng)域,比如說聽覺數(shù)據(jù)告訴握力傳感器如何握緊物體,或者視覺數(shù)據(jù)告訴麥克風(fēng)如何分離聲音。
現(xiàn)實(shí)世界是一個(gè)復(fù)雜的環(huán)境,這里的數(shù)據(jù)更嘈雜,信息量更大。無論數(shù)據(jù)類型如何,都能夠利用這些數(shù)據(jù)對(duì)于可靠理解和與現(xiàn)實(shí)交互非常重要。
所以你會(huì)發(fā)現(xiàn),這些研究本有趣,而且事實(shí)上也很重要。正如描述這項(xiàng)研究的博客文章所言:“我們專注于使用機(jī)器人技術(shù),這不僅會(huì)生產(chǎn)出更有能力的機(jī)器人,還將在未來數(shù)年或者數(shù)十年內(nèi)挑戰(zhàn)人工智能的極限。如果我們想要更接近像人類那樣思考、計(jì)劃和推理的機(jī)器,那么我們需要構(gòu)建人工智能系統(tǒng),使其能夠在多種場(chǎng)景中自主學(xué)習(xí),不僅僅是在虛擬的數(shù)字世界。”
隨著各大網(wǎng)絡(luò)社交媒體不斷擴(kuò)大其影響力,其應(yīng)用程序和服務(wù)的的范圍涉及日常生活的方方面面,它對(duì)人工智能助力的要求也就越來越復(fù)雜。
雖然我們不會(huì)很快看到一個(gè)“Facebook機(jī)器人”,但未來可期。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 6 大模型下半場(chǎng):Agent時(shí)代為何更需要開源模型
- 7 中國“智造”背后的「關(guān)鍵力量」
- 8 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 9 營收猛增46%,昆侖萬維成為AI“爆品工廠”
- 10 地平線自動(dòng)駕駛方案解讀