進(jìn)化中的AI數(shù)字人,從多屏信息流通走向多模態(tài)情感交互
@科技新知 原創(chuàng)
作者丨古廿
編輯丨伊頁
萬物互聯(lián)網(wǎng)的5G時(shí)代,每個(gè)人要和多少塊屏幕產(chǎn)生互動。
在OPPO泛智能終端的生態(tài)里,這個(gè)答案可能是7塊甚至更多。除了以智能手機(jī)為主的屏幕之外,還有已經(jīng)推出的手表、電視、AR/VR等其他多種智能設(shè)備。
伴隨著智能硬件的增多,毫無疑問,在萬物互聯(lián)時(shí)代,一人多屏的泛碎片化交互場景越多越來。在多屏協(xié)同的場景里,智能助手正在成為多屏信息流通的交互樞紐。
從手指觸摸一塊手機(jī)屏幕到多屏協(xié)同下的多模態(tài)語音交互,發(fā)生改變的不僅僅是人與機(jī)器信息溝通的物理形態(tài),還有交互方式帶來的情感變化。
作為國內(nèi)首個(gè)月活破億的手機(jī)語音助手,OPPO小布助手敏銳地關(guān)注到交互變革趨勢,率先向具備多維情緒感知和交互能力的方向創(chuàng)新進(jìn)化。
在三周年之際,OPPO小布助手以“溫暖、機(jī)智、有趣”為理念,上線全新功能,以多模態(tài)情感交互,為用戶提供溫暖、貼心、可信賴的數(shù)智生活體驗(yàn)。
01當(dāng)語音走出硬件
據(jù)Strategy Analytics的分析師透露,智能音箱已經(jīng)成為了近年來發(fā)展最快的新硬件市場。到2023年,63%的美國家庭至少有一臺智能音箱。
國內(nèi)市場方面,根據(jù)Omdia數(shù)據(jù)預(yù)計(jì)到2022年,中國智能音箱銷量將達(dá)到4650萬臺,2020年-2025年復(fù)合增長率達(dá)到20.5%。
作為語音交互的代表型產(chǎn)品,高增長的智能音箱是語音交互爆發(fā)性發(fā)展的表現(xiàn)之一,但遠(yuǎn)遠(yuǎn)不是語音交互的最終形態(tài)。
在科技新知看來,語音交互的發(fā)展大致可以總結(jié)為三個(gè)層次:
第一階段,智能手機(jī)時(shí)代。以語音作為手機(jī)內(nèi)置工具,扮演工具和技術(shù)的角色,是手機(jī)的附屬能力。這一時(shí)期,它是手機(jī)可選的一項(xiàng)服務(wù),經(jīng)過設(shè)置,可以在你需要時(shí),用它設(shè)定鬧鐘和日程提醒。
這一階段,語音交互功能被稱為語音助手,不是手機(jī)最重要的功能,但是一種新的交互方式,并被用戶嘗鮮式低頻使用。
第二階段,智能音箱時(shí)代。語音開始走出手機(jī)屏幕,成為獨(dú)立的硬件產(chǎn)品,其中智能音箱是大部分語音交互的主流硬件產(chǎn)品形態(tài)。這一時(shí)期,語音交互作為多設(shè)備信息流通的交互樞紐,扮演連接者的角色。
這一階段,走出手機(jī)屏幕的語音交互功能被智能音箱所代表,簡單連接起多設(shè)備的智能場景,智能音箱成為也成為新的硬件入口被各大廠商看重并搶占。
第三階段,多模態(tài)情感時(shí)代。語音走出屏幕,走出音箱,走出硬件定義產(chǎn)品。作為一個(gè)獨(dú)立產(chǎn)品——智能助手,以更多元的形態(tài)和場景為落地載體,承擔(dān)獨(dú)立的平臺應(yīng)用服務(wù)角色。
這一階段,走出硬件的智能助手,流通于多設(shè)備、多場景,連接人和機(jī)器的物理交互,也連接人與AI的情感陪伴。
如果說過去十年語音交互主要集中在硬件入口的低維之爭,那么未來十年走出硬件的智能語音產(chǎn)品,將走向人類智能助手這一獨(dú)立產(chǎn)品的高維之爭。
一方面不再局限于語音是硬件的附屬功能,在強(qiáng)調(diào)萬物互融的OPPO看來,小布助手是實(shí)現(xiàn)萬物互融戰(zhàn)略最關(guān)鍵的角色之一,奠定了小布作為智能助手的獨(dú)立產(chǎn)品定位。結(jié)合用戶場景,小布助手持續(xù)投入技術(shù)研發(fā),比如目前小布助手的語義理解模型在行業(yè)最權(quán)威的中文語言理解測評基準(zhǔn)上持續(xù)處于第一梯隊(duì)的位置。
另一方面不依附于某一硬件單品,作為獨(dú)立智能助手,小布助手廣泛搭載在OPPO萬物互融生態(tài)下的多種IoT設(shè)備。截至目前,小布助手已經(jīng)累計(jì)覆蓋2.5億用戶,月活躍用戶數(shù)突破1.3億,月交互次數(shù)達(dá)20億。
硬件是智能助手的實(shí)物載體,但是當(dāng)其走出硬件單品,成為獨(dú)立產(chǎn)品,以多模態(tài)的形式和場景為落體載體,承擔(dān)獨(dú)立的平臺應(yīng)用服務(wù)角色,卻擁抱了更大的多端泛硬件生態(tài)。
02“溫暖、機(jī)智、有趣”的情感互融
作為智能助手,小布助手走出屏幕,走出硬件的同時(shí),其角色也正在從信息連接者走向智能服務(wù)者。
不同于以往功能導(dǎo)向的語音交互,扮演服務(wù)者角色的智能助手,如今也正在多場景下和人類建立情感互融的多模態(tài)連接,打破人與硬件機(jī)器語言的原生疏離感。
自2018年誕生,如今三歲的OPPO小布助手聚焦“溫暖、機(jī)智、有趣”三個(gè)核心理念,相繼上線AI升溫計(jì)劃、老年人關(guān)懷版、小布有童心、多設(shè)備互聯(lián)互找等新功能,以多模態(tài)深度學(xué)習(xí)AI技術(shù),實(shí)現(xiàn)在不同場景下的情景交融。
具體來說,OPPO發(fā)布行業(yè)首創(chuàng)“小布有童心”功能。通過算法識別用戶語音進(jìn)行特征分析(包括說話人的性別和年齡段等多維度屬性),區(qū)分成人與兒童。
當(dāng)兒童用戶向小布提問時(shí),小布會自動切換成“妙趣童音”,以兒童口吻給出反饋,并呈現(xiàn)對應(yīng)的視覺動效。在聲音語氣之外,回答的信息內(nèi)容上,也將反饋更適合兒童理解的信息。
實(shí)現(xiàn)在兒童場景下,以兒童視角+兒童音色+UI可愛有趣的動態(tài)效果來進(jìn)行回復(fù),讓整個(gè)人機(jī)交互的過程充滿溫度和妙趣童真。
針對老年人群體,小布助手發(fā)布行業(yè)首創(chuàng)“小布助手關(guān)懷版”。老年用戶通過簡單的語音口令即可開啟關(guān)懷模式。
在這個(gè)交互界面下,常用指令的界面字體跟圖標(biāo)顯示調(diào)大,同時(shí)增大音量,更方便老年用戶看手機(jī)與辨別聲音。
對于老年人語音方面使用不便的問題,操作上只需點(diǎn)擊相應(yīng)的功能卡片,不用語音也可以使用智能助手,極大程度改善了老年用戶使用智能手機(jī)的體驗(yàn)。
在情感互動場景下,小布助手推出行業(yè)首創(chuàng)“AI升溫計(jì)劃”。通過更準(zhǔn)確的語義分析,識別用戶不同的情緒狀態(tài),采用“開心、感激、夸贊和難過”等4種擬人情緒,加強(qiáng)情感化交互能力。
比如當(dāng)小布感知到用戶很失落時(shí),小布就會用溫柔而有耐心的音色和用戶互動。在虛擬形象、動作上,小布也會展現(xiàn)出想要躍出屏幕,給到用戶擁抱的姿態(tài)。當(dāng)聽到用戶夸贊小布可愛時(shí),小布的聲音也會變得雀躍,開心地播放滿屏煙火。
通過識別用戶的情緒狀態(tài),以溫情的文本回復(fù)及具有情緒變化的TTS音色,配合暖萌有趣的UI視覺效果與用戶互動,給出多模態(tài)的情感反饋。
以上三大行業(yè)首創(chuàng)功能,更多的是作為智能助手,小布情感關(guān)懷溫暖的一面。在這之外,作為智能助手,機(jī)智也是小布必備的綜合能力之一。比如最新發(fā)布的多設(shè)備互聯(lián)互找、AI助憶等功能。
多設(shè)備互聯(lián)互找功能,則是在原有跨設(shè)備語音控制能力的基礎(chǔ)上,進(jìn)一步推進(jìn)小布智能終端中樞的能力升級,在多設(shè)備之間扮演更機(jī)智的角色。
比如設(shè)備遺忘是多設(shè)備用戶經(jīng)常面臨的大問題,有時(shí)候著急出門突然忘了手機(jī)在哪,用戶只需要對著小布助手喊一句“你好小布”,這時(shí)其他的設(shè)備,比如手表或者電視,都會急速響應(yīng),幫用戶快速找到手機(jī),反之亦然。
不僅遺忘設(shè)備,記憶遺忘也是人會經(jīng)常面臨的問題,但是記憶對于機(jī)器來說卻是最擅長的事情。
AI助憶功能,就是小布助手通過自身的AI能力,來幫助用戶加深記憶。比如某個(gè)人,某件事、某個(gè)時(shí)間、某個(gè)位置等等這些對于用戶來說關(guān)鍵的信息點(diǎn),都可以通過小布來進(jìn)行記憶。
目前小布助手已經(jīng)支持生日、紀(jì)念日、位置、開學(xué)時(shí)間等十幾個(gè)屬性的記憶能力,除此之外還支持生日和紀(jì)念日主動提醒,可以再也不用擔(dān)心錯過重要日期了。
溫暖、機(jī)智之外,作為全面全能的智能助手,博聞強(qiáng)識的小布助手也可以給用戶呈現(xiàn)有趣的一面。
3.0版本的小布助手持續(xù)推出“答案之書、天文技巧、民樂小百科、AI譜曲”等趣味黑科技,全方面讓用戶體驗(yàn)到科技帶來的樂趣。
多種新功能的加入,溫暖、機(jī)智、有趣的情感互融交互下,橫向增加小布語言表現(xiàn)力的同時(shí),也進(jìn)一步縱向加深了小布語言的情感理解。
03進(jìn)化中的AI數(shù)字人
作為智能助手,多種新功能的迭代加入,只是小布“溫暖、機(jī)智、有趣”的一部分。在這之外,作為多模態(tài)情感學(xué)習(xí)的獨(dú)立產(chǎn)品,走出硬件的小布助手交互模態(tài)進(jìn)一步升級,推出小布虛擬人。
作為業(yè)界首個(gè)基于虛擬人多模態(tài)交互的智能助手,小布虛擬人打破了人與機(jī)器之間單純的語言交互形式,將人與機(jī)器之間的交互,演化為人與虛擬人之間的交互。
在虛擬人的交互形式下,智能助手可以和用戶實(shí)現(xiàn)多個(gè)場景生態(tài)下的內(nèi)容服務(wù)能力、實(shí)時(shí)交互以及更豐富的情感化交互。比如在電商場景下,定制一些具備品牌特色的帶貨主播虛擬人,在天氣場景定制具備地域特色的天氣主播等。
不同于此前大熱的偶像派虛擬人,比如初音未來、洛天依等虛擬偶像,往往被作為元宇宙數(shù)字的一種內(nèi)容景觀被消費(fèi)。實(shí)力派的智能助手小布虛擬人,作為有溫度的人機(jī)對話溝通載體,更多是現(xiàn)實(shí)世界與數(shù)字世界之間,需要一種更具視覺化、沉浸式和情感溫度的交互方式。
因此,作為兩個(gè)人與元宇宙世界溝通的橋梁,虛擬人還有很多想象空間。比如面向未來,在更多的情感互動層面,小布虛擬人還將提供更加個(gè)性化的定制能力,逐步開放發(fā)音定制、形象定制、性格定制、內(nèi)容服務(wù)定制等開放能力。
在開發(fā)者層面,OPPO和開發(fā)者一起為億萬用戶建立技術(shù)橋梁,逐步開放并允許開發(fā)者為小布定制更多場景所需的虛擬人,搭載到更多智能設(shè)備上。
正如小布虛擬人發(fā)布時(shí),OPPO數(shù)智工程事業(yè)部總裁劉海鋒表示:“希望構(gòu)建一個(gè)以小布助手為中心,多端觸達(dá)的開放生態(tài),通過小布實(shí)現(xiàn)智能設(shè)備之間的萬物互融”。
走出硬件產(chǎn)品,接入更廣泛硬件生態(tài)的獨(dú)立智能助手,在這些未來逐步面向開發(fā)者和用戶開放的交互功能上,OPPO小布助手正在逐步演化為元宇宙世界的AI數(shù)字原生居民,從而進(jìn)化為人類元宇宙數(shù)字世界的最佳伙伴。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評>> 【評選】維科杯·OFweek2025中國工業(yè)自動化及數(shù)字化行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 小米YU7新增835公里續(xù)航版,6-7月面市
- 3 昆侖萬維24年?duì)I收56億,AI出海商業(yè)化獲重要進(jìn)展
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 大模型下半場:Agent時(shí)代為何更需要開源模型
- 8 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 9 中國“智造”背后的「關(guān)鍵力量」
- 10 全球無人駕駛技術(shù)排名:誰才是細(xì)分賽道的扛把子?