訂閱
糾錯
加入自媒體

華為云地協(xié)同方案加速網(wǎng)絡(luò)AI規(guī)模應(yīng)用

2020-09-27 09:14
IT168
關(guān)注

人工智能經(jīng)歷了六十多年的浮浮沉沉,隨著計算算力的進(jìn)步,算法的創(chuàng)新和互聯(lián)網(wǎng)發(fā)展下的海量數(shù)據(jù)積累,人工智能技術(shù)未來十年將煥發(fā)出新的活力,成為最具有沖擊力的科技發(fā)展趨勢之一。

電信網(wǎng)絡(luò)作為信息通信的基礎(chǔ)設(shè)施,具有應(yīng)用人工智能技術(shù)的巨大空間和潛力。如何利用人工智能算法提供的強(qiáng)大分析、判斷、預(yù)測等能力,賦能網(wǎng)元、網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng),并將其與電信網(wǎng)絡(luò)的規(guī)劃、建設(shè)、維護(hù)、運(yùn)行和優(yōu)化等工作內(nèi)容結(jié)合起來,成為電信業(yè)關(guān)注的重要課題。

在HUAWEI CONNECT 2020期間,華為基于對電信領(lǐng)域的深刻理解和多年經(jīng)驗沉淀,帶來了《云地協(xié)同加速網(wǎng)絡(luò)AI規(guī)模商用使能實(shí)現(xiàn)自動駕駛網(wǎng)絡(luò)》的分享,旨在結(jié)合電信領(lǐng)域應(yīng)用場景,使能網(wǎng)絡(luò)達(dá)到自動、自愈、自優(yōu)和自治的自動駕駛網(wǎng)絡(luò),提升整個網(wǎng)絡(luò)的效率,降低OPEX。

電信行業(yè)面臨挑戰(zhàn)呼喚ADN

我們正進(jìn)入一個跨界競爭的新時代,每個行業(yè)都面臨著結(jié)構(gòu)性挑戰(zhàn),電信行業(yè)尤其如此。新趨勢下,電信網(wǎng)絡(luò)正面臨以下三大挑戰(zhàn):

業(yè)務(wù)復(fù)雜:網(wǎng)絡(luò)所聯(lián)接的業(yè)務(wù)越來越多,無人機(jī)、汽車、AR/VR…從B2C到B2C、B2X,網(wǎng)絡(luò)所支撐的業(yè)務(wù)越來越復(fù)雜;

運(yùn)維復(fù)雜:從4G到5G,2-3-4-5四代同堂,十余種網(wǎng)絡(luò)協(xié)議,數(shù)千網(wǎng)絡(luò)特性,上萬配置參數(shù),網(wǎng)絡(luò)運(yùn)維復(fù)雜度激增;

聯(lián)接復(fù)雜:萬物智能,使得聯(lián)接密度增加了100倍,聯(lián)接移動性達(dá)到了150km/h,聯(lián)接的數(shù)據(jù)量增加1000倍,聯(lián)接復(fù)雜度前所未有;

要解決電信網(wǎng)絡(luò)面臨的挑戰(zhàn),僅僅靠產(chǎn)品創(chuàng)新遠(yuǎn)遠(yuǎn)不夠,需要整個系統(tǒng)架構(gòu)創(chuàng)新和商業(yè)模式創(chuàng)新,才能提升運(yùn)營商的競爭力,解決結(jié)構(gòu)性問題。從2018年開始,為實(shí)現(xiàn)網(wǎng)絡(luò)自動化和智能化,電信行業(yè)組織、運(yùn)營商和設(shè)備商紛紛啟動技術(shù)探索。

華為在2018年即提出電信行業(yè)邁向ADN五級演進(jìn)標(biāo)準(zhǔn),為實(shí)現(xiàn)自動駕駛網(wǎng)絡(luò)提供了參考。另外,以中國聯(lián)通、中國移動、BT、法電、Telstra為代表的運(yùn)營商,以及以華為、愛立信為代表的設(shè)備供應(yīng)商均積極開展相關(guān)實(shí)踐,網(wǎng)絡(luò)智能化、自動化成為行業(yè)熱點(diǎn)。

近10年來,華為從ALL IP,ALL Cloud進(jìn)入ALL Intelligence時代,在架構(gòu)創(chuàng)新的道路上從未停止。2019年4月,華為正式發(fā)布iMaster NAIE網(wǎng)絡(luò)AI云服務(wù),為華為網(wǎng)絡(luò)智能化戰(zhàn)略實(shí)施的的重要里程碑。

不僅如此,華為自動駕駛網(wǎng)絡(luò)(ADN)秉承“把復(fù)雜留給自己,把簡單帶給客戶”的思想,以網(wǎng)絡(luò)極簡和智能運(yùn)維為核心理念規(guī)劃、設(shè)計和開發(fā)產(chǎn)品,通過云端+AI、網(wǎng)絡(luò)+AI和網(wǎng)元+AI的三層AI開放架構(gòu)“給網(wǎng)絡(luò)以智能,給運(yùn)維以平臺”,加速電信運(yùn)營商數(shù)字化和智能化轉(zhuǎn)型。

云地協(xié)同加速AI特性規(guī)模應(yīng)用

近年來,全球業(yè)界各方在網(wǎng)絡(luò)AI方面紛紛進(jìn)行積極的探索和實(shí)踐,經(jīng)過驗證在運(yùn)維效率、能耗效率、網(wǎng)絡(luò)資源利用率以及用戶業(yè)務(wù)體驗提升等方面確實(shí)能夠帶來價值,電信產(chǎn)業(yè)走向智能化已經(jīng)成為整個行業(yè)的共識。但在實(shí)踐中,也發(fā)現(xiàn)網(wǎng)絡(luò)AI在走向規(guī)模化工程應(yīng)用的過程中存在很多挑戰(zhàn),如模型重訓(xùn)練占用資源多、模型版本升級管理難度大、本地樣本少、模型精度不夠等問題。

模型重訓(xùn)練占用資源多:從實(shí)踐統(tǒng)計來看,一些場景都會發(fā)生因泛化、或數(shù)據(jù)偏移而導(dǎo)致的模型精度下降問題,如無線流量預(yù)測、DC PUE優(yōu)化等,AI模型都需要進(jìn)行重訓(xùn)練。AI模型訓(xùn)練一般會占用較多系統(tǒng)資源,如在網(wǎng)元或網(wǎng)管實(shí)施重訓(xùn)練任務(wù),訓(xùn)練效率低,同時也可能會影響設(shè)備性能。

模型版本升級管理難度大:很多場景的AI模型都是一站一模型,如無線基站智能節(jié)能等,各站點(diǎn)的模型都根據(jù)本地化數(shù)據(jù)進(jìn)行定制化訓(xùn)練。各局點(diǎn)模型版本不同,升級頻度也不同,成千上萬的站點(diǎn)模型,管理難度很大。需要有一個統(tǒng)一的平臺,高效實(shí)現(xiàn)模型狀態(tài)的監(jiān)控和版本升級策略等管理任務(wù)。

本地樣本少、模型精度不夠:部分場景單局點(diǎn)樣本量少,不足以支撐模型訓(xùn)練,如核心網(wǎng)KPI異常檢測,單局點(diǎn)發(fā)生異常頻率很少,訓(xùn)練需要的樣本量不夠。因此,需要能夠匯聚所有局點(diǎn)的全量樣本信息,可能還需輔以聯(lián)邦學(xué)習(xí)等技術(shù),才能訓(xùn)練得到滿足業(yè)務(wù)精度要求的AI模型。

云地協(xié)同實(shí)現(xiàn)架構(gòu)

針對以上問題,華為提出云地協(xié)同創(chuàng)新方案,通過云地協(xié)同,可以加速AI特性的規(guī)模部署。

云地協(xié)同,是指云端和地端一起協(xié)作完成數(shù)據(jù)樣本上云,模型狀態(tài)管理,模型重訓(xùn)練,模型/知識下發(fā)、擇優(yōu)更新等一系列的閉環(huán)任務(wù),同時把云端匯集的全局網(wǎng)絡(luò)知識經(jīng)驗、全量數(shù)據(jù)訓(xùn)練得到的高精度模型,持續(xù)注入地端,讓電信網(wǎng)絡(luò)能夠進(jìn)行智能的迭代升級,變得越來越聰明。

云地協(xié)同有三個主要的特征:一是云端和地端要有通道;二是地端到云端,信息可以從運(yùn)營商上傳到云端,包括數(shù)據(jù)樣本、模型狀態(tài)、以及重訓(xùn)練請求等信息,三是云端到地端可以下發(fā)新的模型,同時網(wǎng)絡(luò)知識庫里的知識也可以注入到地端。

云地協(xié)同機(jī)制參見下圖:

云地協(xié)同三個階段

據(jù)介紹,云地協(xié)同在實(shí)際應(yīng)用部署時有三個階段,針對不同場景可以選擇適合的階段,最終大幅提高網(wǎng)絡(luò)的資源效率。

階段1:云端進(jìn)行初始模型的訓(xùn)練,運(yùn)行態(tài)由地端根據(jù)新增的樣本進(jìn)行在線學(xué)習(xí),持續(xù)保持模型的精度。這種模式主要是適用于模型相對簡單,算法結(jié)構(gòu)比較穩(wěn)定的場景,這種場景一般不需要對模型結(jié)構(gòu)和算法本身進(jìn)行更改,只需要根據(jù)本地數(shù)據(jù)進(jìn)行在線學(xué)習(xí),優(yōu)化調(diào)整模型參數(shù)。比如像核心網(wǎng)變更在線機(jī)器值守等。

階段2:云端進(jìn)行模型的分發(fā),然后在地端根據(jù)新增樣本進(jìn)行在線學(xué)習(xí)。具體講,就是云端會持續(xù)對模型進(jìn)行優(yōu)化,包括模型算法結(jié)構(gòu)上的,優(yōu)化后的模型會進(jìn)行推送到地端,地端根據(jù)評估結(jié)果進(jìn)行模型擇優(yōu)更新。同時,地端也會根據(jù)本地數(shù)據(jù)樣本的學(xué)習(xí)進(jìn)行模型參數(shù)的優(yōu)化。這種一般適合于模型相對復(fù)雜,華為會持續(xù)進(jìn)行模型算法結(jié)構(gòu)優(yōu)化的場景,比如無線KPI 異常檢測等。

階段3:云地實(shí)時協(xié)同,模型可以自動化演進(jìn),具體講就是本地樣本會實(shí)時上傳到云端,云端進(jìn)行訓(xùn)練和優(yōu)化后的模型會自動推送到地端,地端進(jìn)行模型評估擇優(yōu)進(jìn)行升級。這種主要是適用于模型復(fù)雜、需要用到華為云端高質(zhì)量標(biāo)注數(shù)據(jù),知識圖譜以及仿真等知識能力進(jìn)行模型優(yōu)化的場景,比如IP RAN/PTN智能告警,DC PUE優(yōu)化等。

云地協(xié)同關(guān)鍵價值

聯(lián)邦學(xué)習(xí),即通過匯聚各個地端模型的參數(shù),在云端采用匯聚算法,形成效果更好的共享模型,再下發(fā)給各個地端進(jìn)行使用,其最大的特點(diǎn),就是在地端數(shù)據(jù)不用出局的情況下,提升模型的精度。借助聯(lián)邦學(xué)習(xí)可以更好的實(shí)現(xiàn)云地協(xié)同,從而提升模型泛化能力和訓(xùn)練效率。

借助知識圖譜,通過沉淀專家經(jīng)驗和產(chǎn)品知識轉(zhuǎn)化形成故障傳播關(guān)系等,形成“網(wǎng)絡(luò)知識庫”,可用于故障運(yùn)維輔助、知識問答等。

在云端仿真方面,通過在云端構(gòu)建虛擬仿真環(huán)境,高效安全地進(jìn)行模型或業(yè)務(wù)驗證,在避免現(xiàn)網(wǎng)性能或KPI受到影響的同時,支撐網(wǎng)絡(luò)問題的快速閉環(huán)。

模型因為需要進(jìn)行更新,更新的方式如果采用傳統(tǒng)網(wǎng)管集成的這種模式,需要經(jīng)過多層多次的人工動作,首先模型版本發(fā)布后,需要產(chǎn)品研發(fā)把模型通過代碼工作集成到網(wǎng)管軟件版本里,然后發(fā)布到華為Support網(wǎng)站。

如果采用自動升級模式,通過云地協(xié)同,讓AI模型市場跟地端網(wǎng)絡(luò)AI對接,模型發(fā)布后進(jìn)行推送,讓地端局點(diǎn)啟動自動化的模型升級,當(dāng)然升級前也會完成模型的評估,整個過程在1個小時即可完成。

總結(jié)來看,云地協(xié)同可以實(shí)現(xiàn)一點(diǎn)生效,全網(wǎng)復(fù)制,AI的特性在一個局點(diǎn)成功實(shí)施后,快速的形成知識和經(jīng)驗,在其他局點(diǎn)進(jìn)行復(fù)制,實(shí)現(xiàn)在全網(wǎng)規(guī)模應(yīng)用。

華為iMaster NAIE讓網(wǎng)絡(luò)AI開發(fā)簡單高效

NAIE是自動駕駛網(wǎng)絡(luò)解決方案的網(wǎng)絡(luò)AI設(shè)計和開發(fā)平臺,由數(shù)據(jù)服務(wù),訓(xùn)練服務(wù),AIOps使能服務(wù),推理框架和生態(tài)服務(wù)五大部分組成。

網(wǎng)絡(luò)AI模型開發(fā)既要懂AI、又要懂網(wǎng)絡(luò),技術(shù)門檻高。模型開發(fā)過程中,既需要懂AI知識,又需要熟悉網(wǎng)絡(luò)業(yè)務(wù)。電信領(lǐng)域?qū)<褹I積累少,可借鑒經(jīng)驗少。而且由于AI算法多,選擇范圍廣,所以導(dǎo)致試錯成本高、開發(fā)效率低;算法科學(xué)家不懂電信業(yè)務(wù),需要花大量時間了解學(xué)習(xí)。模型訓(xùn)練依賴大量并且昂貴的計算資源,調(diào)參優(yōu)化周期長,訓(xùn)練耗時高、周期長。

NAIE訓(xùn)練平臺,提供一站式高效模型訓(xùn)練,集成業(yè)界通用的主流AI算法框架,包括Mindspore、Tensorflow、SParkML、Caffe2、MXNet等,內(nèi)嵌華為在網(wǎng)絡(luò)領(lǐng)域30多年的知識和經(jīng)驗沉淀,支持電信領(lǐng)域的特征處理,輔助快速識別等關(guān)鍵特征,內(nèi)置電信領(lǐng)域AI典型算法,如異常檢測、根因分析、優(yōu)化控制、業(yè)務(wù)預(yù)測等,支持模型快速驗證。目前主要包括三類服務(wù):模型訓(xùn)練服務(wù)、模型生成服務(wù)和通信模型服務(wù)(在線推理),可以滿足不同層次的人員對于模型開發(fā)的需求。

不僅如此,華為還提供了豐富的NAIE培訓(xùn)服務(wù),線上線下結(jié)合,助力運(yùn)營商人才轉(zhuǎn)型。

總結(jié)

未來是智能化的時代,運(yùn)營商網(wǎng)絡(luò)智能化不可能一蹴而就,而是一個長期實(shí)踐。華為自動駕駛網(wǎng)絡(luò)解決方案是華為All Intelligence戰(zhàn)略在電信領(lǐng)域的落地,而iMaster NAIE做為智能化部件,將使能自動駕駛網(wǎng)絡(luò)。核心的AI能力依托華為在All Intelligence中長期堅決的戰(zhàn)略投入而積累成長,和電信領(lǐng)域場景想結(jié)合,幫助運(yùn)營商盡快實(shí)現(xiàn)數(shù)字化,智能化轉(zhuǎn)型。

作者:陶然編輯: 陶然來源:IT168網(wǎng)站  原創(chuàng)

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號