訂閱
糾錯(cuò)
加入自媒體

MCU,智能覺醒

圖片

根據(jù)IoT Analytics的報(bào)告,全球物聯(lián)網(wǎng)MCU市場(chǎng)規(guī)模預(yù)計(jì)到2030年將達(dá)到73億美元,年復(fù)合增長(zhǎng)率約為6.3%。這一增長(zhǎng)主要得益于自動(dòng)化升級(jí)需求的釋放、LPWAN項(xiàng)目的推動(dòng)、AI向邊緣遷移的趨勢(shì)以及亞洲尤其是中國(guó)市場(chǎng)的快速增長(zhǎng)。AI技術(shù)的融入正在徹底改寫MCU的生存邏輯。而AI技術(shù)的深度融入,正從底層改寫MCU的技術(shù)邏輯與市場(chǎng)格局,催生出兼具低功耗、實(shí)時(shí)性與智能推理能力的AI MCU,成為物聯(lián)網(wǎng)智能化發(fā)展的載體。

圖片

AI MCU通過集成神經(jīng)網(wǎng)絡(luò)處理單元(NPU)、擴(kuò)展專用指令集等方式,實(shí)現(xiàn)了邊緣端的本地智能推理,精準(zhǔn)匹配了智能設(shè)備對(duì)低功耗、高實(shí)時(shí)性和高性價(jià)比的需求。這不僅推動(dòng)了MCU產(chǎn)品的升級(jí),更讓市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈,國(guó)內(nèi)外各大芯片廠商紛紛加大研發(fā)投入,推出各具技術(shù)特色的AI MCU產(chǎn)品,加速邊緣智能應(yīng)用的落地。

01

Arm:構(gòu)筑AI MCU核心技術(shù)底座

作為全球領(lǐng)先的處理器架構(gòu)設(shè)計(jì)公司,Arm的內(nèi)核產(chǎn)品線覆蓋了從高性能計(jì)算到低功耗嵌入式應(yīng)用的全場(chǎng)景,自1990年成立以來,已形成Cortex-A、Cortex-M、Cortex-R三大系列產(chǎn)品,以及面向服務(wù)器/基礎(chǔ)設(shè)施的Neoverse系列,各系列基于ARMv7、ARMv8、ARMv9等不同架構(gòu)版本設(shè)計(jì),針對(duì)專屬應(yīng)用場(chǎng)景完成深度優(yōu)化。

其中,Cortex-M系列是微控制器(MCU)和嵌入式系統(tǒng)的核心處理器內(nèi)核,以低功耗、高實(shí)時(shí)性和高成本效益為核心特性,支持單周期指令執(zhí)行、納秒級(jí)快速中斷響應(yīng),最小內(nèi)核尺寸僅0.01mm²,搭配Thumb-2指令集,無MMU且可運(yùn)行RTOS,是目前絕大多數(shù)MCU產(chǎn)品的技術(shù)基石,也成為Arm布局AI MCU的核心切入點(diǎn)。

為了讓Cortex-M系列具備更強(qiáng)的AI計(jì)算能力,Arm推出了一系列專屬技術(shù)與內(nèi)核產(chǎn)品。2019年,Arm發(fā)布適用于Armv8M架構(gòu)的Cortex-M矢量擴(kuò)展技術(shù)(MVE)——Arm Helium技術(shù),作為Armv8.1-M架構(gòu)的擴(kuò)展,該技術(shù)通過高效的SIMD(單指令多數(shù)據(jù))操作,為機(jī)器學(xué)習(xí)(ML)和數(shù)字信號(hào)處理(DSP)應(yīng)用帶來顯著性能提升,在機(jī)器學(xué)習(xí)任務(wù)中可實(shí)現(xiàn)最高15倍的性能突破。而Arm Helium Utils作為CMSIS DSP庫的組成部分,還為該技術(shù)提供了一系列實(shí)用函數(shù),進(jìn)一步優(yōu)化DSP和ML任務(wù)的處理效率。

Cortex-M55和Cortex-M85是首批支持Helium技術(shù)的處理器,讓小型、低功耗的嵌入式系統(tǒng)能夠應(yīng)對(duì)音頻設(shè)備、傳感器集線器、關(guān)鍵詞識(shí)別、靜態(tài)圖像處理等場(chǎng)景的計(jì)算挑戰(zhàn),也讓基于Arm內(nèi)核的MCU具備更強(qiáng)的AI處理能力。2023年,Arm再度推出專為AI應(yīng)用設(shè)計(jì)的Cortex-M52處理器,不僅實(shí)現(xiàn)了能效的進(jìn)一步提升,成為Cortex-M3、Cortex-M33等主流MCU內(nèi)核的替代選擇,更借助Helium技術(shù)實(shí)現(xiàn)了DSP和ML處理能力的顯著升級(jí),將AI驅(qū)動(dòng)的創(chuàng)新引入更多低功耗嵌入式場(chǎng)景。

除了內(nèi)核本身的升級(jí),Arm還推出了面向Cortex-M系列的microNPU——Ethos-U55,專為面積受限的嵌入式和物聯(lián)網(wǎng)設(shè)備設(shè)計(jì),可大幅加速M(fèi)L推理性能。當(dāng)Ethos-U55與Cortex-M55協(xié)同部署時(shí),相較于傳統(tǒng)的Cortex-M系統(tǒng),機(jī)器學(xué)習(xí)性能可提升高達(dá)480倍,為低成本、高能效的AI MCU解決方案提供了支撐。

在國(guó)內(nèi),安謀科技也基于Arm架構(gòu)完成了本土化創(chuàng)新,其自主研發(fā)的第三代高能效嵌入式芯片IP“星辰”STAR-MC3,基于Arm v8.1-M架構(gòu)打造,向前兼容傳統(tǒng)MCU架構(gòu),同時(shí)集成Arm Helium 技術(shù),在顯著提升CPU AI計(jì)算性能的同時(shí),兼顧優(yōu)異的面效比與能效比,成為AIoT領(lǐng)域主控芯片及協(xié)處理器的核心架構(gòu),助力客戶高效部署端側(cè)AI應(yīng)用。

02

RISC-V:AI MCU的另一技術(shù)路線

除了Arm架構(gòu),RISC-V憑借開源、靈活的特性,成為AI MCU的另一重要技術(shù)選擇,其矢量擴(kuò)展(RVV)技術(shù)可讓處理器內(nèi)核加速海量數(shù)據(jù)集的單指令流計(jì)算,完美適配機(jī)器學(xué)習(xí)、圖像壓縮處理、數(shù)據(jù)加密、音視頻多媒體處理、語音識(shí)別和自然語言處理等任務(wù)——而這些正是物聯(lián)網(wǎng)端側(cè)AI落地的核心計(jì)算需求,也吸引了眾多企業(yè)基于RISC-V架構(gòu)打造AI MCU產(chǎn)品,形成與Arm架構(gòu)互補(bǔ)的技術(shù)格局。

如今,谷歌已通過與合作方Synaptics共同將基于RISC-V的Coral NPU架構(gòu)推向市場(chǎng)。Coral NPU是基于RISC-V指令集架構(gòu),包含一個(gè)四階標(biāo)量CPU核心、一個(gè)32位RISC-V向量引擎以及一個(gè)專門為現(xiàn)代Transformer模型優(yōu)化的矩陣核心加速器。谷歌給 Coral NPU 的定位是“一個(gè)全棧、開源的平臺(tái),旨在解決性能、碎片化和隱私這三大核心挑戰(zhàn),而這些挑戰(zhàn)限制了功能強(qiáng)大、始終在線的 AI 技術(shù)在低功耗邊緣設(shè)備和可穿戴設(shè)備上的應(yīng)用!

國(guó)內(nèi)外廠商:AI MCU產(chǎn)品落地加速

依托Arm Helium、RISC-V RVV等技術(shù),國(guó)內(nèi)外芯片廠商紛紛推出自研AI MCU產(chǎn)品,從高端高算力到入門級(jí)解決方案,覆蓋不同應(yīng)用場(chǎng)景,推動(dòng)AI MCU的商業(yè)化落地。

國(guó)際大廠:技術(shù)領(lǐng)先,布局全場(chǎng)景

瑞薩電子的RA8系列作為業(yè)界首個(gè)基于Arm Cortex-M85內(nèi)核的MCU系列,兼具M(jìn)PU的高性能與MCU的易用性、低功耗和低BOM成本,支持單核或雙核設(shè)計(jì),最高可實(shí)現(xiàn)1GHz的CPU主頻、0.25 TOPS NPU算力,還集成了包含EtherCAT在內(nèi)的多協(xié)議工業(yè)網(wǎng),可滿足AI、工業(yè)以太網(wǎng)、機(jī)器人、HMI等高算力應(yīng)用需求。在此基礎(chǔ)上,瑞薩推出的RA8P1微控制器產(chǎn)品群,采用Cortex-M85(1GHz)+Cortex-M33(250MHz)的雙核異構(gòu)設(shè)計(jì),并集成Arm EthosTM-U55 NPU,借助Arm Helium技術(shù)實(shí)現(xiàn)了DSP和AI/ML性能的大幅提升,樹立了MCU性能的新標(biāo)桿。

意法半導(dǎo)體的STM32N6則是首款內(nèi)嵌自研神經(jīng)處理單元(NPU)——ST Neural-ART accelerator的STM32 MCU,專為節(jié)能型邊緣AI應(yīng)用設(shè)計(jì),其搭載的Arm Cortex-M55內(nèi)核主頻高達(dá)800MHz,結(jié)合Arm Helium向量處理技術(shù)顯著增強(qiáng)DSP處理能力,芯片整體時(shí)鐘頻率可達(dá)1GHz,計(jì)算性能達(dá)600 GOPS,能為計(jì)算機(jī)視覺和音頻應(yīng)用提供實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)推理能力。

恩智浦的i.MX RT700系列則以多內(nèi)核架構(gòu)實(shí)現(xiàn)智能算力的分層部署,該系列擁有5個(gè)計(jì)算內(nèi)核,主計(jì)算子系統(tǒng)包含325MHz的Arm Cortex-M33核與Cadence Tensilica HiFi 4 DSP,超低功耗感知子系統(tǒng)則搭配第二款Cortex-M33核與Cadence Tensilica HiFi 1 DSP,無需外部傳感器集線器,有效降低系統(tǒng)設(shè)計(jì)復(fù)雜度與BOM成本。同時(shí),該系列集成恩智浦eIQ Neutron NPU,可將AI工作處理速度提高172倍,還內(nèi)置7.5MB板載SRAM,為可穿戴設(shè)備、醫(yī)療設(shè)備、智能家居等邊緣智能設(shè)備提供算力支撐。

英飛凌的PSoC Edge E81、E83、E84系列均基于Arm Cortex-M55內(nèi)核打造,支持Arm Helium DSP指令集,同時(shí)搭配不同的AI加速單元:E81搭載英飛凌自研超低功耗NNLite神經(jīng)網(wǎng)絡(luò)加速器,E83和E84則內(nèi)置Arm Ethos-U55微型NPU,與傳統(tǒng)Cortex-M系統(tǒng)相比機(jī)器學(xué)習(xí)性能提升480倍,且三款產(chǎn)品均集成豐富外設(shè)、片上存儲(chǔ)器和硬件安全功能,支持WiFi 6、BT/BLE、Matter協(xié)議等,適配低功耗計(jì)算領(lǐng)域的機(jī)器學(xué)習(xí)應(yīng)用。

德州儀器則依托DSP技術(shù)優(yōu)勢(shì)布局AI MCU,其C2000 MCU系列的TMS320F28P550 MCU,搭載150MHz C28x 32位DSP CPU,集成浮點(diǎn)單元(FPU32)與三角函數(shù)加速器(TMU),并內(nèi)置NPU實(shí)現(xiàn)邊緣AI計(jì)算,算力達(dá)600–1200 MOPS,支持本地運(yùn)行CNN模型,適配工業(yè)控制等場(chǎng)景的AI需求。

國(guó)內(nèi)企業(yè):緊跟趨勢(shì),本土化適配突出

國(guó)內(nèi)芯片廠商也在AI MCU領(lǐng)域快速突破,結(jié)合本土物聯(lián)網(wǎng)應(yīng)用場(chǎng)景完成產(chǎn)品優(yōu)化,同時(shí)實(shí)現(xiàn)了RISC-V架構(gòu)的落地應(yīng)用,形成差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。

新唐科技推出的NuMicro M55M1是定位入門級(jí)的AI MCU解決方案,專為AI數(shù)據(jù)識(shí)別、智能音頻等邊緣應(yīng)用打造,基于Arm Cortex-M55核心設(shè)計(jì),搭載Arm Ethos-U55 NPU與Helium向量處理器,AI運(yùn)算能力達(dá)110 GOPS,相較于傳統(tǒng)1GHz MCU,AI推理性能實(shí)現(xiàn)超100倍突破,還內(nèi)置1.5MB RAM、2MB Flash并支持外擴(kuò)存儲(chǔ)。同時(shí),新唐科技還推出自研NuML Tool Kit開發(fā)工具,并提供人臉識(shí)別、物體識(shí)別等多款現(xiàn)成AI模型,大幅降低AI應(yīng)用開發(fā)門檻,加速產(chǎn)品落地。

國(guó)芯科技則聚焦RISC-V架構(gòu)的AI MCU研發(fā),其端側(cè)AI MCU芯片CCR4001S已實(shí)現(xiàn)10萬顆交貨,該芯片采用RISC-V內(nèi)核,主頻230MHz,集成0.3 TOPS @INT8算力的NPU,可高效運(yùn)行MobileNet、ResNet、Yolo等深度學(xué)習(xí)算法,實(shí)現(xiàn)物體識(shí)別、目標(biāo)檢測(cè)等復(fù)雜任務(wù),同時(shí)兼具低功耗特性,尤其適配空調(diào)智能控制等家電智能化場(chǎng)景,支持客戶自主導(dǎo)入算法模型并完成迭代優(yōu)化。此外,國(guó)芯科技還與賽昉科技聯(lián)合推出CCR7002芯片,通過多芯片封裝技術(shù)集成高性能SoC與低功耗AI芯片子系統(tǒng),同樣提供0.3TOPS的NPU算力,實(shí)現(xiàn)RISC-V架構(gòu)與AI的深度融合。

樂鑫科技的ESP32-S3則在通用MCU基礎(chǔ)上增加了AI算力支持,這款集成2.4GHz Wi-Fi和Bluetooth 5 (LE)的MCU,搭載Xtensa 32位LX7雙核處理器,主頻240MHz,新增的向量指令可加速神經(jīng)網(wǎng)絡(luò)計(jì)算和信號(hào)處理,開發(fā)者通過ESP-DSP、ESP-NN等庫即可實(shí)現(xiàn)圖像識(shí)別、語音喚醒等AI應(yīng)用,適配智能家居等輕量級(jí)邊緣智能場(chǎng)景。

華為海思則針對(duì)家電端側(cè)智能化推出Hi3066M,這款微算力嵌入式AI MCU采用海思自有RISC-V內(nèi)核,內(nèi)置eAI引擎,主頻200MHz,搭配64KB SRAM和512KB內(nèi)置Flash,可適配空調(diào)、冰箱、洗衣機(jī)等白電的AI節(jié)能、智能檢測(cè)等場(chǎng)景,同時(shí)預(yù)留了足夠的存儲(chǔ)空間,滿足未來5~10年的產(chǎn)品升級(jí)需求,是華為首款端側(cè)eAI芯片。

03

結(jié)語

AI與MCU的融合,已逐漸從技術(shù)探索走向商業(yè)化落地。隨著邊緣智能需求的持續(xù)釋放,以及芯片廠商在算力、功耗、成本和開發(fā)工具上的不斷優(yōu)化,AI MCU將成為更多智能設(shè)備的算力載體,在智能家居、工業(yè)控制、消費(fèi)電子、醫(yī)療設(shè)備等領(lǐng)域?qū)崿F(xiàn)更廣泛的應(yīng)用,推動(dòng)物聯(lián)網(wǎng)產(chǎn)業(yè)向更智能、更高效的方向發(fā)展。

值得關(guān)注的是,中國(guó)作為RISC-V生態(tài)最核心的推動(dòng)者與踐行者,也是全球RISC-V芯片應(yīng)用最活躍的國(guó)家。相較于Arm架構(gòu)芯片,我們所能深入了解的往往僅限于其外設(shè)、調(diào)試系統(tǒng)、總線結(jié)構(gòu)及指令集,卻缺乏有效渠道窺探Cortex-M內(nèi)核的核心細(xì)節(jié),無法深入掌握芯片內(nèi)部流水線等關(guān)鍵技術(shù);而RISC-V的開源特性恰好解決了這一痛點(diǎn)。更為重要的是,它大幅降低了內(nèi)核學(xué)習(xí)門檻,能夠培養(yǎng)出一大批深入掌握內(nèi)核技術(shù)的專業(yè)人才。

如今,在MCU中融入AI功能,已成為一件司空見慣的事情,這一趨勢(shì)也將持續(xù)推動(dòng)邊緣智能產(chǎn)業(yè)的深度發(fā)展。

       原文標(biāo)題 : MCU,智能覺醒

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)