打造未來人機(jī)交互新通道,AI語音合成還需趨利避害
如今,隨著新一代科技革命和產(chǎn)業(yè)變革的到來,人工智能技術(shù)愈發(fā)受到了越來越多國家和企業(yè)的青睞。今年以來,我國連續(xù)第三次將人工智能寫入政府工作報(bào)告之中,且提出“智能+新概念”;國內(nèi)35所高校成功建設(shè)人工智能相關(guān)專業(yè)和學(xué)院;以及人社部等三部門發(fā)布人工智能有關(guān)新職業(yè),無不推動(dòng)了人工智能建設(shè)的提速發(fā)展。
而作為人工智能重要分支之一,AI語音技術(shù)也在這樣積極向上的大環(huán)境中迎來了快速崛起。目前,除了傳統(tǒng)意義上的AI語音識(shí)別、AI語音服務(wù)等之外,全球又誕生出了AI語音合成、AI語音辨人等新突破和新應(yīng)用。其中,AI語音合成由于在應(yīng)用上的“善惡難定”,更是引發(fā)了人們的廣泛關(guān)注和爭(zhēng)議。
AI語音合成技術(shù)發(fā)展迅猛
眾所周知,交流和交互的方式有很多種,比如語言、文字、圖像、動(dòng)作等等。在人機(jī)交互方面,從上世紀(jì)70年代開始,人類便在不斷探索最便捷、最自然的交流方式,不管是計(jì)算機(jī)時(shí)代的鍵盤打字,還是智能手機(jī)時(shí)代的觸摸屏,都是對(duì)應(yīng)時(shí)代的潮流創(chuàng)新式探索。而如今,顯然輪到了AI語音技術(shù)。
據(jù)了解,語音交互對(duì)人機(jī)語音通信的作用主要依賴兩方面技術(shù),其一是語音識(shí)別技術(shù),其二便是語音合成技術(shù)。和語音識(shí)別相比,目前語音合成的技術(shù)相對(duì)說來要成熟一些,并已開始向產(chǎn)業(yè)化方向成功邁進(jìn),大規(guī)模應(yīng)用指日可待。不過,AI與語音合成的融合發(fā)展尚處于起步探索階段。
在此過程中,以科大訊飛、阿里、百度、搜狗、谷歌等為代表的一大批先進(jìn)科技企業(yè),都在助推AI語音合成技術(shù)的穩(wěn)步突破。
比如2018年,谷歌便隆重推出了一款A(yù)I語音合成器,作為其機(jī)器學(xué)習(xí)云工具套件的一部分,該合成器能滿足任何開發(fā)人員和企業(yè)的語音合成需求。此外,今年阿里達(dá)摩院也再度秀出了新型的AI語音合成技術(shù),不僅定制成本降低了10倍,同時(shí)能夠讓企業(yè)與個(gè)人定制其專屬“AI聲音”。
總的來說,在各大科技巨頭的加速布局與持續(xù)突破下,目前AI語音合成在技術(shù)上已經(jīng)取得了不小成果,商業(yè)化應(yīng)用探索也開始逐步啟動(dòng),發(fā)展速度令人咋舌。未來,隨著應(yīng)用的日漸成熟,產(chǎn)品大規(guī)模進(jìn)入市場(chǎng),AI語音技術(shù)走進(jìn)人們的日常生產(chǎn)和生活指日可待。
現(xiàn)實(shí)生活中應(yīng)用愈發(fā)廣泛
那么,AI語音合成技術(shù),到底能在哪些領(lǐng)域獲得應(yīng)用呢?
從當(dāng)前來看,AI語音合成能落地的領(lǐng)域著實(shí)不少,比如影視娛樂、汽車行業(yè)、銷售服務(wù)行業(yè)等等。其中,在影視娛樂方面,2017年以來我國已經(jīng)利用AI語音合成技術(shù)打造了《創(chuàng)新中國》等極具創(chuàng)新性的節(jié)目,由人工智能合成配音的紀(jì)錄片打破了人們的固有印象,原來除了指令語和提示音,AI加語音還能夠合成出如此惟妙惟肖的自然聲音。
與此同時(shí),我國還利用AI語音合成讓那些曾經(jīng)美好但卻已逝去的聲音重返人間。2016年的百度世界大會(huì)上,百度大腦便利用情感語音合成技術(shù)再現(xiàn)了港星張國榮的聲音,讓觀眾與已在天堂的“哥哥”來了場(chǎng)“隔空對(duì)話”。此外,央視也通過人工智能技術(shù)模擬《焦點(diǎn)訪談》主播員李易嗓音,讓人聽后好評(píng)如潮。
而在汽車行業(yè),在人們聽?wèi)T了一眾林志玲、郭德綱等導(dǎo)航的聲音之后,AI語音合成技術(shù)無疑帶來了更多的選擇。就像阿里推出的新一代語音合成技術(shù)KAN-TTS,將其應(yīng)用到汽車導(dǎo)航之中,人們便能夠獲得獨(dú)一無二定制化的導(dǎo)航提示聲音,這進(jìn)一步豐富了大家的出行體驗(yàn)和生活趣味性。
除此之外,利用AI語音合成的聲音應(yīng)用在客服、教育、銷售等方面,都能大大提高用戶體驗(yàn)和人機(jī)交互感受。由此可見,AI語音合成的確大有用武之地!
行善or作惡引發(fā)人們爭(zhēng)議
當(dāng)然,作為一項(xiàng)剛剛興起缺乏監(jiān)管的創(chuàng)新性技術(shù),其負(fù)面應(yīng)用也有不少,比如有人借助該技術(shù)進(jìn)行詐騙,也有人利用該技術(shù)進(jìn)行惡搞......這些應(yīng)用不僅侵犯了人們的名譽(yù)和財(cái)產(chǎn),同時(shí)也危害了大家的隱私和信息安全,令人倍感煩惱。
行善還是作惡?這一問題困擾著人們對(duì)于AI語音合成應(yīng)用的看法。
但其實(shí),就像硬幣有兩面、利劍有雙刃一樣,任何技術(shù)都有善惡之用,關(guān)鍵在于使用的人和是否有良好的監(jiān)管;诖,AI語音合成技術(shù)也是這樣,只有培養(yǎng)了人們對(duì)技術(shù)的正確認(rèn)識(shí),加強(qiáng)了對(duì)技術(shù)研發(fā)和應(yīng)用的完善監(jiān)管,才能讓該技術(shù)趨利避害、實(shí)現(xiàn)善用。
今年4月份,政府在《民法典人格權(quán)編(草案)》里加了這樣一條規(guī)定:任何組織和個(gè)人不得以利用信息技術(shù)手段偽造的方式侵害他人的肖像權(quán)。也就是說,政府對(duì)于AI語音合成技術(shù)的監(jiān)管正在變得完善。
而未來,隨著更加明確規(guī)范AI新產(chǎn)品和應(yīng)用的專項(xiàng)法律的陸續(xù)出臺(tái),AI語音合成的應(yīng)用可能將變得更加向善行善,我們對(duì)此滿懷期待!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng)>> 【評(píng)選】維科杯·OFweek2025中國工業(yè)自動(dòng)化及數(shù)字化行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 小米YU7新增835公里續(xù)航版,6-7月面市
- 3 昆侖萬維24年?duì)I收56億,AI出海商業(yè)化獲重要進(jìn)展
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 大模型下半場(chǎng):Agent時(shí)代為何更需要開源模型
- 8 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 9 中國“智造”背后的「關(guān)鍵力量」
- 10 全球無人駕駛技術(shù)排名:誰才是細(xì)分賽道的扛把子?