大環(huán)境:AI工業(yè)大生產(chǎn)還缺什么?
文/當下君
AI領域的發(fā)展,在2021年開啟了“外卷模式”。
外卷,網(wǎng)絡用語,指通過向外拓展新的資源的方式進行競爭,是“內卷”的反義詞。
和部分領域因為缺乏技術創(chuàng)新而被迫開始內卷相對應,AI領域充沛的技術紅利,使之不斷外卷,積極向外拓展資源,集合社會力量而形成新的大生態(tài)。
過去,人們認為,只要把平臺、產(chǎn)品和服務打磨好,做出成熟的通用性解決方案,并在各個細分領域推廣落地,AI就可以水到渠成。
但事實上,AI領域的瓜熟蒂落,從不依賴某一個單點突破,它需要一個完整的生態(tài),而且并不是圍繞單一企業(yè)建設的狹義生態(tài),而是真正意義上“產(chǎn)、學、研、用”結合的社會大生態(tài)。
只有真正完成整個AI大生態(tài)的拼圖,AI才能整體的降臨,而本文則記錄了許許多多為這個目標努力的機構和個人。
1、大環(huán)境:AI工業(yè)大生產(chǎn)還缺什么?
公眾對科技發(fā)展的節(jié)點的認知往往是非常感性的,比如對于普通人來說,iPhone的問世就說明移動互聯(lián)網(wǎng)時代的開啟,阿爾法狗戰(zhàn)勝人類棋手則意味著AI時代的到來。
但在真實世界里,一種新的技術從理念突破、技術突破到工程突破,乃至于最后的商業(yè)化落地,過程漫長且艱難。
美國科學哲學家托馬斯·塞繆爾·庫恩的《科學革命的結構》是科學哲學的經(jīng)典之作,他的研究表明——上世紀中葉以往的科學,更多地表現(xiàn)為個體勞動的特征(小科學);現(xiàn)代科學技術的發(fā)展,促使這種勞動方式發(fā)生改變,它使科學制度化、專業(yè)化和集約化的程度大大提高(大科學)。
但大科學的社會化落地,并不僅僅依賴一些代表性的科學成就的出現(xiàn),它更多程度上,需要人類作為一個共同體,承認、參與和推廣這些代表性成就,并形成共識、形成生態(tài),成為社會發(fā)展的主范式。
我們期待的AI技術驅動的第四次工業(yè)革命,AI工業(yè)大生產(chǎn)時代,正在到來。
AI的工業(yè)大生產(chǎn)必須有兩個標志,第一,AI是基礎源動力;第二,圍繞AI進行的能力輸出,被體系化、生態(tài)化并形成新的商業(yè)閉環(huán)。
一些數(shù)字化原生企業(yè),已經(jīng)率先在內部形成了AI工業(yè)大生產(chǎn),例如較有代表性的百度,企業(yè)內部已經(jīng)形成AI底座,體系化的對各類型業(yè)務持續(xù)賦能,在百度內部形成了AI大生產(chǎn)的格局,簡單說,就是AI成為主引擎,以AI驅動各種業(yè)務,以AI能力形成主要差異化競爭力。
某種意義上,百度正是把自己多年“踩坑”才探索出的AI大生產(chǎn)平臺,通過“外化”的方式,試圖發(fā)展成全社會的“AI大生產(chǎn)平臺”,并在此之上聯(lián)合社會各界,開始共創(chuàng)啟動AI大生產(chǎn)所需要的“AI大生態(tài)”。
這個大生產(chǎn)平臺就是飛槳。即使把對比的維度放到世界范圍內,我們也可以基本篤定的說——百度的飛槳產(chǎn)業(yè)級深度學習開源開放平臺,是典型的AI大生產(chǎn)平臺,它賦能廣大開發(fā)者,有力支撐AI工業(yè)大生產(chǎn),促進技術創(chuàng)新和產(chǎn)業(yè)智能化升級。
飛槳為古老的東方國度在新世紀里具備世界競爭力在賦能。
飛槳的成績,絕不僅僅是百度一家在努力的結果,一組數(shù)據(jù)很能說明問題——飛槳發(fā)布至今,已經(jīng)凝聚了406萬開發(fā)者,創(chuàng)建47.6萬模型,服務15.7萬個企事業(yè)單位,位居中國深度學習平臺綜合市場份額第一。
上面的三組關鍵數(shù)據(jù),就是我們所說的,一個新的技術“主范式”所能凝聚的社會共識和產(chǎn)生的社會效應。它突出的表現(xiàn)在,這些開發(fā)者基本全部是百度之外的,他們所創(chuàng)建的模型、所服務的領域,也絕非僅僅在數(shù)字化程度較高的局部行業(yè)里,而是真正的千行百業(yè)。
有一個統(tǒng)計數(shù)據(jù)是中國有4200萬工程師,如果從這個緯度來看,飛槳至少已經(jīng)讓中國10%的工程師成為了AI開發(fā)者,當然這個數(shù)字不一定精確,但至少從宏觀規(guī)模上透視了一個現(xiàn)象——當一個技術體系能夠讓一個國家10%的工程技術人員去嘗試、學習和探索,并且繼續(xù)計劃要培養(yǎng)500萬AI人才的時候,那么,AI工業(yè)大生產(chǎn)的核心要素——人力資源,就可能具備了。
當然,如此多的人能夠順利的實現(xiàn)AI探索,而他們絕大多數(shù)并不曾接受體系化的AI教育,那么就必然得出一個結論——飛槳平臺提供了強大的工具體系,極大的降低了AI學習、開發(fā)和使用的門檻。
2、工具,越來越好用的工具
人類是在學會使用工具后,才改變這個世界的,AI就是我們創(chuàng)造未來的工具體系。
12月12日,由深度學習技術及應用國家工程實驗室主辦的WAVE SUMMIT+2021深度學習開發(fā)者峰會在上海召開,飛槳在會上發(fā)布了十大最新技術和生態(tài)進展,其中,技術的進步誠然讓我們震撼——比如飛槳新版全景圖—產(chǎn)業(yè)級模型庫新增文心大模型、飛槳開源框架v2.2 體系化新增科學計算API、端到端自適應大規(guī)模分布式訓練技術等。
從筆者的觀察視角,那些工具/平臺的更新和利于生態(tài)發(fā)展的進展,更是本文重點考察的目標——即飛槳是如何通過有效的提供工具+完善生態(tài),來幫助千行百業(yè)實現(xiàn)“產(chǎn)、學、研、用”正循環(huán)。
這方面的進展也非常多,如業(yè)界首個產(chǎn)業(yè)實踐范例庫、飛槳“大航!2.0共創(chuàng)計劃、多層次低成本的硬件適配方案、產(chǎn)業(yè)級開源模型庫模型超過400個、企業(yè)版升級自動高效的模型部署功能,以及1分鐘極速安裝完成本地高效建模的飛槳EasyDL桌面版等。
工欲善其事,必先利其器,有了不斷降低AI開發(fā)門檻的“武器”,才有AI工業(yè)大生產(chǎn)的早日到來。
百度CTO、深度學習技術及應用國家工程實驗室主任王海峰在會上講的一句話非常重要,他說:“當今,人工智能呈現(xiàn)出融合創(chuàng)新和降低門檻的特點:一方面,AI技術及產(chǎn)業(yè)的融合創(chuàng)新越來越多;另一方面,雖然AI技術越來越復雜,但AI開發(fā)與應用的門檻卻越來越低”。
融合創(chuàng)新增加、技術的復雜性增加,但開發(fā)應用的門檻降低,才是AI大生態(tài)形成的基本條件,也是百度的核心能力的體現(xiàn)。
比如,大模型現(xiàn)在是很熱的概念,公眾的感知是“很先進,很前沿”,但百度從降低門檻的實際出發(fā),并不一味追求規(guī)模大、參數(shù)多,而是通過飛槳平臺,讓基于大模型的開發(fā),變得高效、靈活、易用,反而解決了大模型的算力需求過大,泛化能力欠佳,經(jīng)常難以解決應用場景中復雜多變的實際問題的傳統(tǒng)難題。
在許多場景化的應用方案中,文心大模型可以實現(xiàn)多尺寸的模型蒸餾,甚至以極小尺寸適配具體需求,降低了大模型使用門檻與成本——在60多項國際著名任務上,百度文心都取得了領先優(yōu)勢,其中有30多項是小樣本、零樣本學習的任務,表明其文心的泛化應用能力更強,可以低門檻適配行業(yè)需求與行業(yè)能力。
更重要的是,通過飛槳這個“操作系統(tǒng)”,普通的AI開發(fā)者也能使用大模型的泛化成果,例如,通過與知識的結合加上跨語言、跨模態(tài)能力的融入,開發(fā)者可以完成更加多樣化、通用化的任務,在通信、金融、醫(yī)療等領域具備廣泛的落地可能性。
飛槳全新發(fā)布了開源框架2.2版本后,在工具與平臺方面,也“下放”了更多的能力和“利器”。
EasyDL和BML雙平臺,是飛槳企業(yè)版最亮眼的“雙子星”,因為它們距離開發(fā)者最近、距離需求最近,此次基于飛槳推理部署工具鏈,與平臺深度融合,升級打造自動高效的企業(yè)級部署等功能。
略說一二。
比如,一個平臺是否受歡迎,很大程度上看硬件的支持力度。飛槳企業(yè)版目前已完成9345種模型芯片組合的真實測試和調優(yōu),可以覆蓋95%的需求場景。
更重要的是,這相比開發(fā)者自行適配,要節(jié)省97%的開發(fā)時間。
當天的現(xiàn)場還有一個明星是一只機器狗,它的本質其實是一個具備邊緣計算能力的硬件平臺,以前,給這種平臺部署一個新的模型,可能要花好幾天;但在飛槳企業(yè)版最新的可視化智能邊緣控制臺的支持下,工程師現(xiàn)場演示了只用5分鐘就部署一個新模型——機器狗快速掌握了識別手勢的新技能,耗時僅僅相當于下載一個APP的時間。
而最新發(fā)布的飛槳EasyDL桌面版,不必繁瑣的配置各種環(huán)境,在桌面一鍵極速安裝即可實現(xiàn)本地高效建模,1分鐘安裝完成,15分鐘就可完成模型開發(fā)。
這樣的例子還有很多,飛槳就是通過這樣一個個細節(jié)的打磨,幫助生態(tài)開發(fā)者節(jié)省一天、一個小時、一分鐘,減少幾千、幾百、幾十個步驟……筆者相信,這才是飛槳能吸引406萬開發(fā)者的核心——誰不希望和一個每天都在成長、不斷“外卷”的生態(tài),一起共創(chuàng)和面向未來呢?
3、人,起決定因素的是人
在WAVE SUMMIT+2021上,令人最有感觸的是人,普通人。
百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜在這天就花了挺長的時間介紹一個普通人。
他叫李桑郁,一位普通的鐵路工人,聽起來和AI似乎搭不上任何關系。
李桑郁的工作內容中,最繁瑣的莫過于人工核對貨運車號,為此,他每年要拍攝、審核20萬張圖片,而且錯誤難以避免。
然而,這個普通的鐵路工人,通過在飛槳AI Studio上自學,最終使用飛槳的開發(fā)套件,在沒有外力的幫助下,自己從頭到尾實現(xiàn)了鐵路貨運車號的自動識別系統(tǒng)的開發(fā)。
使用了新系統(tǒng)之后,原來人工需要幾個小時的工作量縮短成了三分鐘,為他所在的襄陽鐵路段節(jié)省了20余萬元的成本。而為了表彰他的工作,襄陽鐵路段為年僅25歲的李桑郁設立了AI創(chuàng)新工作室。
一個普通的、但熱愛鉆研的鐵路工人,和易學易用的飛槳組合,就在百年工業(yè)——鐵路系統(tǒng),實現(xiàn)了一個環(huán)節(jié)的AI飛躍。
將來改變中國AI史的,可能是百度的高級科學家們,但更可能是通過幾百萬個李桑郁這樣普通的、但有學習、攻關能力的一線業(yè)務人員,他們從AI先行者變成了AI工作坊的主持人,并必然進階為AI工業(yè)大生產(chǎn)的“關鍵先生”。
另一個非常有魅力的是Wave Summit的開發(fā)者市集,這里展示的完全是一些以AI開發(fā)為愛好的普通人的作品。
外貿電商從業(yè)者劉心怡是個很清秀的女生,她帶來的是名為“星星的孩子”的孤獨癥兒童互動游戲。
北郵的一批學子們,帶來了“復活東坡”項目,畫中的蘇東坡動了起來,通過實時語音合成與唇形驅動,完美的實現(xiàn)了前賢與今人跨越千年的對話。
而令百度的專家們、開發(fā)經(jīng)理們都大為嘆服,而且推薦筆者“一定要去”參觀的是一位名叫王京京的開發(fā)者的展位,他展示的是一套視覺驅動的“石頭剪子布”機械手,但其實真正的奧秘是他開發(fā)的攝像頭——通過和飛槳EasyDL的結合,這個攝像頭可以像下載軟件一樣靈活的增加功能,適用從最專業(yè)的工業(yè)質檢到最質樸的兒童游戲。
我們可以預想,隨著AI原生時代的開啟,一批生于AI時代、視AI為社交貨幣的年輕人被不斷“外卷”成為生態(tài)的一份子后,將會形成這樣一種發(fā)展范式——利用飛槳強大的能力,一批個人工作室、創(chuàng)業(yè)公司崛起,他們不貪大求全,在細分領域卻鉆的很深,他們人數(shù)眾多,多到改變AI的人才結構。
其實,吳甜在會上也說了一句切中要害的話,她說:飛槳的建設,要持續(xù)地進行技術創(chuàng)新,要永遠以開發(fā)者的需求為首位,要和整個生態(tài)一起共享和共創(chuàng)。
所以,我們也看到,吳甜帶來的“大航!庇媱2.0的發(fā)布,在“領航”、“啟航”、“護航”的基礎上增加了“共創(chuàng)”計劃。共創(chuàng)計劃包含三方面:第一,以飛槳平臺為基座,社區(qū)開發(fā)者共創(chuàng)工具、模型、產(chǎn)業(yè)案例與實踐經(jīng)驗;第二,形成產(chǎn)業(yè)創(chuàng)新需求對接平臺,共創(chuàng)產(chǎn)學研用正循環(huán);第三,與更多生態(tài)伙伴一起建設產(chǎn)業(yè)賦能中心,共創(chuàng)區(qū)域創(chuàng)新生態(tài)。
這個“共創(chuàng)”就可以理解為“外卷”,也就是不斷向外部拓展資源,通過讓更多開發(fā)者共創(chuàng)工具、模型,把更多的產(chǎn)業(yè)案例與實踐經(jīng)驗,把更多的產(chǎn)業(yè)需求對接,更多的區(qū)域伙伴創(chuàng)新生態(tài),都“卷”到AI大生態(tài)里面來。最終形成產(chǎn)學研用的正循環(huán)。
向外無限延伸,正是外卷的特征,也是一個生態(tài)正處于快速成長期的表征。
寫到這里,如果略微梳理,我們不難發(fā)現(xiàn),百度不僅有首席AI架構師培養(yǎng)計劃(AICA)這樣的高端項目,也有和教育部、科技部、各大高校的合作計劃,有面對更普及層次的AI實用人才的百萬級培訓目標,更有把許許多多企業(yè)加入飛槳技術伙伴生態(tài)的大航!白o航”計劃,所有的一切,都是為了讓整個生態(tài)活起來,形成正循環(huán)。
如果我們樂觀一點估計,在全國的工程技術人員中具有一定AI開發(fā)能力者,占比達到30%甚至50%的時候,我們期待的AI工業(yè)大生產(chǎn),將無可阻擋的到來。
這一天,并不遙遠。
轉載請留言
并注明來自「當下Tech」

請輸入評論內容...
請輸入評論/評論長度6~500個字