訂閱
糾錯(cuò)
加入自媒體

打造未來人機(jī)交互新通道,AI語音合成還需趨利避害

如今,隨著新一代科技革命和產(chǎn)業(yè)變革的到來,人工智能技術(shù)愈發(fā)受到了越來越多國家和企業(yè)的青睞。今年以來,我國連續(xù)第三次將人工智能寫入政府工作報(bào)告之中,且提出“智能+新概念”;國內(nèi)35所高校成功建設(shè)人工智能相關(guān)專業(yè)和學(xué)院;以及人社部等三部門發(fā)布人工智能有關(guān)新職業(yè),無不推動(dòng)了人工智能建設(shè)的提速發(fā)展。

而作為人工智能重要分支之一,AI語音技術(shù)也在這樣積極向上的大環(huán)境中迎來了快速崛起。目前,除了傳統(tǒng)意義上的AI語音識(shí)別、AI語音服務(wù)等之外,全球又誕生出了AI語音合成、AI語音辨人等新突破和新應(yīng)用。其中,AI語音合成由于在應(yīng)用上的“善惡難定”,更是引發(fā)了人們的廣泛關(guān)注和爭(zhēng)議。

AI語音合成技術(shù)發(fā)展迅猛

眾所周知,交流和交互的方式有很多種,比如語言、文字、圖像、動(dòng)作等等。在人機(jī)交互方面,從上世紀(jì)70年代開始,人類便在不斷探索最便捷、最自然的交流方式,不管是計(jì)算機(jī)時(shí)代的鍵盤打字,還是智能手機(jī)時(shí)代的觸摸屏,都是對(duì)應(yīng)時(shí)代的潮流創(chuàng)新式探索。而如今,顯然輪到了AI語音技術(shù)。

據(jù)了解,語音交互對(duì)人機(jī)語音通信的作用主要依賴兩方面技術(shù),其一是語音識(shí)別技術(shù),其二便是語音合成技術(shù)。和語音識(shí)別相比,目前語音合成的技術(shù)相對(duì)說來要成熟一些,并已開始向產(chǎn)業(yè)化方向成功邁進(jìn),大規(guī)模應(yīng)用指日可待。不過,AI與語音合成的融合發(fā)展尚處于起步探索階段。

在此過程中,以科大訊飛、阿里、百度、搜狗、谷歌等為代表的一大批先進(jìn)科技企業(yè),都在助推AI語音合成技術(shù)的穩(wěn)步突破。

比如2018年,谷歌便隆重推出了一款A(yù)I語音合成器,作為其機(jī)器學(xué)習(xí)云工具套件的一部分,該合成器能滿足任何開發(fā)人員和企業(yè)的語音合成需求。此外,今年阿里達(dá)摩院也再度秀出了新型的AI語音合成技術(shù),不僅定制成本降低了10倍,同時(shí)能夠讓企業(yè)與個(gè)人定制其專屬“AI聲音”。

總的來說,在各大科技巨頭的加速布局與持續(xù)突破下,目前AI語音合成在技術(shù)上已經(jīng)取得了不小成果,商業(yè)化應(yīng)用探索也開始逐步啟動(dòng),發(fā)展速度令人咋舌。未來,隨著應(yīng)用的日漸成熟,產(chǎn)品大規(guī)模進(jìn)入市場(chǎng),AI語音技術(shù)走進(jìn)人們的日常生產(chǎn)和生活指日可待。

現(xiàn)實(shí)生活中應(yīng)用愈發(fā)廣泛

那么,AI語音合成技術(shù),到底能在哪些領(lǐng)域獲得應(yīng)用呢?

從當(dāng)前來看,AI語音合成能落地的領(lǐng)域著實(shí)不少,比如影視娛樂、汽車行業(yè)、銷售服務(wù)行業(yè)等等。其中,在影視娛樂方面,2017年以來我國已經(jīng)利用AI語音合成技術(shù)打造了《創(chuàng)新中國》等極具創(chuàng)新性的節(jié)目,由人工智能合成配音的紀(jì)錄片打破了人們的固有印象,原來除了指令語和提示音,AI加語音還能夠合成出如此惟妙惟肖的自然聲音。

與此同時(shí),我國還利用AI語音合成讓那些曾經(jīng)美好但卻已逝去的聲音重返人間。2016年的百度世界大會(huì)上,百度大腦便利用情感語音合成技術(shù)再現(xiàn)了港星張國榮的聲音,讓觀眾與已在天堂的“哥哥”來了場(chǎng)“隔空對(duì)話”。此外,央視也通過人工智能技術(shù)模擬《焦點(diǎn)訪談》主播員李易嗓音,讓人聽后好評(píng)如潮。

而在汽車行業(yè),在人們聽?wèi)T了一眾林志玲、郭德綱等導(dǎo)航的聲音之后,AI語音合成技術(shù)無疑帶來了更多的選擇。就像阿里推出的新一代語音合成技術(shù)KAN-TTS,將其應(yīng)用到汽車導(dǎo)航之中,人們便能夠獲得獨(dú)一無二定制化的導(dǎo)航提示聲音,這進(jìn)一步豐富了大家的出行體驗(yàn)和生活趣味性。

除此之外,利用AI語音合成的聲音應(yīng)用在客服、教育、銷售等方面,都能大大提高用戶體驗(yàn)和人機(jī)交互感受。由此可見,AI語音合成的確大有用武之地!

行善or作惡引發(fā)人們爭(zhēng)議

當(dāng)然,作為一項(xiàng)剛剛興起缺乏監(jiān)管的創(chuàng)新性技術(shù),其負(fù)面應(yīng)用也有不少,比如有人借助該技術(shù)進(jìn)行詐騙,也有人利用該技術(shù)進(jìn)行惡搞......這些應(yīng)用不僅侵犯了人們的名譽(yù)和財(cái)產(chǎn),同時(shí)也危害了大家的隱私和信息安全,令人倍感煩惱。

行善還是作惡?這一問題困擾著人們對(duì)于AI語音合成應(yīng)用的看法。

但其實(shí),就像硬幣有兩面、利劍有雙刃一樣,任何技術(shù)都有善惡之用,關(guān)鍵在于使用的人和是否有良好的監(jiān)管;诖,AI語音合成技術(shù)也是這樣,只有培養(yǎng)了人們對(duì)技術(shù)的正確認(rèn)識(shí),加強(qiáng)了對(duì)技術(shù)研發(fā)和應(yīng)用的完善監(jiān)管,才能讓該技術(shù)趨利避害、實(shí)現(xiàn)善用。

今年4月份,政府在《民法典人格權(quán)編(草案)》里加了這樣一條規(guī)定:任何組織和個(gè)人不得以利用信息技術(shù)手段偽造的方式侵害他人的肖像權(quán)。也就是說,政府對(duì)于AI語音合成技術(shù)的監(jiān)管正在變得完善。

而未來,隨著更加明確規(guī)范AI新產(chǎn)品和應(yīng)用的專項(xiàng)法律的陸續(xù)出臺(tái),AI語音合成的應(yīng)用可能將變得更加向善行善,我們對(duì)此滿懷期待!

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)