123,123

MLPerf公布首輪AI推理基準測試結(jié)果，平頭哥含光800單芯片推理性能第一

2019-11-08 16:52

11月7日報道

北京時間11月7日，MLPerf基準聯(lián)盟公布首輪AI推理基準測試結(jié)果，阿里巴巴平頭哥的AI芯片含光800在Resnet50基準測試中獲得單芯片性能第一。

MLPerf 推理基準測試設有五個基準，每個對應四種場景，重點面向圖像分類、對象檢測和機器翻譯等常見機器學習任務。測試者可以選擇提交任何基準及相應場景的結(jié)果。

含光800參加了適用于圖像分類任務的Resnet50v1．5基準測試，在離線模式（Offline mode）、服務模式（Servermode）、多路模式（Multi stream mode）和單路模式（Single stream mode）四個場景都取得了單芯片第一的成績。

離線模式測試的是芯片推理的最大吞吐量，最能考驗芯片的計算、存儲、通信等基本功。含光800的成績?yōu)?9306．60IPS，單芯片性能是谷歌TPUv3的8．5倍、Nvidia T4的12倍。

MLPerf是業(yè)內(nèi)首套衡量機器學習軟硬件性能的通用基準，由圖靈獎得主David？Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起。

MLPerf基準聯(lián)盟現(xiàn)有50多家成員，包括谷歌、微軟、Facebook、阿里巴巴等企業(yè)和斯坦福、哈佛、多倫多大學等高校。

圖片24.png

繼AI訓練基準v0．5、v0．6之后，MLPerf在今年6月推出AI推理基準v0．5。參加本輪推理基準測試并提交結(jié)果的公司共14家，谷歌（TPUv3）、英偉達（T4、RTX、Xavier）、英特爾（CLX 9282、NNPI－1000）、Habana（Goya）等呈現(xiàn)了當前AI推理系統(tǒng)最高水平的競逐。

今年9月問世的含光800是阿里巴巴第一款正式流片的AI芯片，基于臺積電12nm工藝生產(chǎn)，其性能突破得益于軟硬件的協(xié)同設計：采用平頭哥自研架構(gòu)，有效降低內(nèi)存訪問延時；集成達摩院的創(chuàng)新算法，深度優(yōu)化CNN及視覺類算法，大幅提升視覺計算效率。

含光800主要用于云端視覺場景，現(xiàn)已大規(guī)模應用于阿里巴巴集團內(nèi)多個場景，如視頻圖像識別／分類／搜索、城市大腦等，未來還可應用于醫(yī)療影像、自動駕駛等領域。

今后，含光800的算力將通過阿里云對外輸出。

作者：郭亞鑫來源：獵云網(wǎng)