訂閱
糾錯
加入自媒體

存儲通脹時代,企業(yè)IT如何尋找“避風(fēng)港”?

圖片

文|魏琳華 劉俊宏

編|王一粟

采購,正在成為讓企業(yè)IT負責(zé)人們集中頭疼的問題。

原本可以直接花錢買到一臺按標(biāo)準配置好的服務(wù)器,現(xiàn)在采購卻常常遇到供應(yīng)商把內(nèi)存、閃存、硬盤拆開賣的情況,還要求客戶額外付費。

“內(nèi)存和存儲部分需要單獨下單,價格比去年翻了一倍多,還不一定有貨。”一位管采購的負責(zé)人吐槽道。

造成上述“采購亂象”的源頭,可以追溯到今年年初美國的“Stargate”(星際之門)計劃。

這個面向AI基礎(chǔ)設(shè)施投資的計劃,要在未來4年內(nèi)投入超過5000億美元,由OpenAI、軟銀、甲骨文等巨頭牽頭。

為了支撐超級集群,它們勢必要吃掉巨量的硬件供貨。今年10月,OpenAI宣布和韓國兩大芯片巨頭三星電子、SK海力士合作,計劃在2029年向兩家公司采購90萬片半導(dǎo)體晶圓。

Stargate天量的需求,直接引發(fā)了全球性的硬件搶購潮。

市場研究機構(gòu)TrendForce數(shù)據(jù)顯示,自今年9月起,DDR4與DDR5內(nèi)存現(xiàn)貨價大幅上漲,其中DDR4價格環(huán)比上漲158%,DDR5現(xiàn)貨價環(huán)比大漲307%;NAND Flash價格漲幅同樣驚人,據(jù)金士頓數(shù)據(jù)中心SSD業(yè)務(wù)經(jīng)理Cameron Crandall透露,其從今年一季度起累計上漲高達246%,其中70%漲幅集中在近60日。

“這是我29年職業(yè)生涯中‘從未見過’的劇烈波動。”Cameron Crandall說。

折射到現(xiàn)實中,對于偏好采用自建數(shù)據(jù)中心或者使用中小型IDC的公司來說,價格增長無疑是一場巨大的風(fēng)險:原本規(guī)劃好的預(yù)算只能買到以前一半的算力;如果為了節(jié)省成本,冒險繼續(xù)使用老舊的存儲硬件,加劇數(shù)據(jù)腐爛的風(fēng)險后,企業(yè)往往得不償失。

在硬件資產(chǎn)開始通脹,“上云”這個輕資產(chǎn)運營的選項,再次被推向臺前。

這一次,上云的意義不再局限于運維層面的便利,而是躲避風(fēng)險、降本增效的手段。通過將硬件漲價的風(fēng)險轉(zhuǎn)移給儲貨充足的云廠商,通過按需付費、彈性擴展,實現(xiàn)綜合降本20%-40%;同時,還能按需調(diào)用云廠商的技術(shù)、產(chǎn)品。

在存儲資源枯竭、價格瘋漲的至暗時刻,是時候重新審視上云的價值了。

AI“黑天鵝”扇動全球IT硬件的翅膀?

IT設(shè)備采購的困境,并不是今年才發(fā)生的。

去年,價格瘋漲的核心問題是AI服務(wù)器。由于英偉達等廠商的GPU產(chǎn)能不足,導(dǎo)致算力卡成為了硬通貨,全球一度一卡難求。但現(xiàn)在,GPU短缺的問題外溢到整個服務(wù)器硬件設(shè)備上。

Stargate項目的橫空出世,全面拉升了服務(wù)器采購的各個相關(guān)部件支出。

首先是存儲的價格“狂飆”。由于AI拉升需求,加上坊間傳聞OpenAI的SamAltman一系列鯨吞存儲晶圓產(chǎn)能的操作,造成出廠價飆升,中小IDC機房的運營成本也跟著直線拉升。據(jù)外媒報道,戴爾、聯(lián)想、HPE等主要制造商正計劃對服務(wù)器產(chǎn)品提價約15%。

因此,許多企業(yè)被迫陷入了兩難境地:要么在高位“接盤”昂貴的硬件,導(dǎo)致現(xiàn)金流緊張;要么延遲擴容計劃,業(yè)務(wù)也受硬件制約難以推進。

為什么一個美國的AI項目,會造成全球IT硬件如此大范圍的緊缺?

這是因為,當(dāng)前的缺口并非簡單的供需失衡,本質(zhì)原因是AI應(yīng)用的需求,直接拔高了各家企業(yè)對基礎(chǔ)設(shè)施的標(biāo)準。

在AI時代,算力不再是唯一的瓶頸。當(dāng)模型參數(shù)量達到萬億級別,訓(xùn)練和推理過程中的數(shù)據(jù)吞吐量以指數(shù)級增長,像是多米諾骨牌,一個變化推動著一系列圍繞計算的新需求出現(xiàn):

實際應(yīng)用中,企業(yè)不僅需要GPU進行矩陣計算,更需要高性能的HBM(高帶寬內(nèi)存,特殊工藝處理的DRAM)和NAND(閃存)來存取運算過程中產(chǎn)生的大量數(shù)據(jù),以便更快地處理數(shù)據(jù);同理,還需要高速光模塊來保障數(shù)據(jù)中心內(nèi)部的數(shù)據(jù)交換,支撐低延遲的需求。此外,就連高密度計算產(chǎn)生的高熱量,讓傳統(tǒng)風(fēng)冷捉襟見肘,液冷等一系列復(fù)雜的機房建設(shè)都成為了標(biāo)配。

圖片

所有需求疊加在一起,導(dǎo)致整個服務(wù)器行業(yè)必須進行一次全方位升級換代。

一場由需求引領(lǐng)的連鎖反應(yīng),落在中小企業(yè)頭上,就是一座沉重的山。

硬件需求的升級意味著漲價,這意味著企業(yè)的服務(wù)器機房成本也要增長。比起花錢翻倍,更頭疼的是“有價無市”。由于新品產(chǎn)能爬坡需要時間,產(chǎn)品交付周期也被無限拉長——當(dāng)你終于批下預(yù)算,等到貨時,報價單又再次根據(jù)市場行情上調(diào)。

在這種由于“硬件通脹”導(dǎo)致的極端環(huán)境下,堅持傳統(tǒng)IT架構(gòu)的企業(yè)背著舊時代組建好的基礎(chǔ)設(shè)施猶如“沉沒成本”:跟進,就要花遠超預(yù)期的投入;不跟進,風(fēng)險和問題難以處理。

比如,一些企業(yè)為了控制失控的成本,開始鋌而走險,轉(zhuǎn)向繼續(xù)使用現(xiàn)有的、即將維保到期的存儲硬件。這種行為相當(dāng)于走鋼絲,可能給企業(yè)帶來風(fēng)險和安全問題。以數(shù)據(jù)腐爛為例,在存儲、傳輸或使用過程中,如果硬件受損,就可能導(dǎo)致企業(yè)存儲的數(shù)據(jù)無法正常被讀取使用。

人們常常把AI比作“第四次工業(yè)革命”,一項新技術(shù)的出現(xiàn),往往會改寫產(chǎn)業(yè)鏈的各個環(huán)節(jié)。蒸汽機的發(fā)明,淘汰了低效手工業(yè),推動了機械化、規(guī)模化產(chǎn)業(yè)的誕生。

在AI時代,繼續(xù)重資產(chǎn)的運營IT架構(gòu),正在走向一條死胡同。

硬件通脹時代,企業(yè)IT需要上云

在硬件成本飆升的情況下,傳統(tǒng)企業(yè) IT 架構(gòu)面臨的核心挑戰(zhàn),還不僅僅是“買不起”,更多問題浮出水面。

其中,服務(wù)器資源利用率過低,資源浪費就是一個頻繁被企業(yè)提起的問題。

對于采用傳統(tǒng)IT采購模式的企業(yè)來說,必須基于未來服務(wù)器資源的需求峰值做規(guī)劃,購買足量的算力資源和存儲資源支撐業(yè)務(wù),“屯算力”、“屯存儲”就變成了常態(tài)。但在實際應(yīng)用中,先不說企業(yè)為了保障業(yè)務(wù)穩(wěn)定運行,往往要購買超量的資源;此外,企業(yè)花費高價采購的存儲和算力,還在絕大多數(shù)非峰值時間段處于閑置狀態(tài),也就是資源浪費。

但在硬件通脹、采購成本翻倍的今天,這種長期處于低負載模式運行的方案,對中小企業(yè)來說顯得過于奢侈。

由此,無論是想要轉(zhuǎn)嫁高昂的基礎(chǔ)設(shè)施成本、還是按需動態(tài)調(diào)用算力,都指向云廠商的核心優(yōu)勢——靠超大規(guī)模算力集群的搭建,讓中小企業(yè)能夠彈性購買服務(wù)。

云廠商服務(wù)之所以能夠讓各行業(yè)客戶買單,它最關(guān)鍵的優(yōu)勢,就是能實現(xiàn)對算力資源的精細化控制。

對于本身需要靠投入基礎(chǔ)設(shè)施,靠規(guī);瘮偙∵呺H成本的云廠商來說,它們的努力方向,就是榨取算力利用,根據(jù)客戶需求“量體裁衣”。

這里以華為云為例,相比于中小企業(yè),云廠商通過大規(guī)模的基礎(chǔ)設(shè)施搭建和技術(shù)優(yōu)化,實現(xiàn)了后者難以企及的成本優(yōu)勢。

最基礎(chǔ)的服務(wù),就是根據(jù)企業(yè)的算力需求做到按需供給。

彈性云服務(wù)器(ECS)就是最基本的量身定制服務(wù)。對于企業(yè)來說,相當(dāng)于擰水龍頭——業(yè)務(wù)高峰期擰大,低谷期擰小。這種“用多少付多少”的模式,避免了企業(yè)大部分時間空置算力的尷尬。包年、包月、競價等多種計費方式,則把服務(wù)價格進一步壓低。

在靈活調(diào)用的基礎(chǔ)上,如何進一步榨取算力的利用率,就是各家云廠商靠技術(shù)做突圍的命題。

以華為云的Flexus X 云服務(wù)器的“柔性算力”為例,通過技術(shù)優(yōu)化,再一次打破了資源供應(yīng)的限制。

圖片

過往,即時云廠商的優(yōu)勢就在于“彈性服務(wù)”,但傳統(tǒng)云服務(wù)器仍然存在能夠優(yōu)化的空間。比如,云廠商往往只提供固定的CPU與內(nèi)存配比,比如2核CPU必須配4G、8G內(nèi)存,遵循1:2次冪的固定配比。但如果你只需要5G的內(nèi)存,那多出來的3G內(nèi)存實際上就被浪費掉了。

圖片

去年,華為云發(fā)布首創(chuàng)的柔性算力就讓CPU和內(nèi)存配比打破了固定比例的限制,它支持以1核1G為單位進行定義,實現(xiàn)1:3、2:5等自定義特殊規(guī)格,做到了更高精度的“量身定制”。同時,配合華為云遷移中心(MgC)的快速平遷,可以根據(jù)企業(yè)業(yè)務(wù)具體負載匹配對應(yīng)服務(wù)器規(guī)格。據(jù)官方數(shù)據(jù),最高能實現(xiàn)綜合成本降低30%。

算力的問題解決了,下一步就是解決存儲問題。數(shù)智化時代,如何安全、便宜地儲存企業(yè)的核心數(shù)據(jù),也同樣是企業(yè)需要解決的痛點。

企業(yè)傳統(tǒng)的數(shù)據(jù)存儲方式,往往存在兩個共性問題:存不下、讀取慢。

存不下,指的是企業(yè)用于存儲的硬盤容量有限,想擴容就需要繼續(xù)買硬件;而隨著硬盤里存的文件越來越多,當(dāng)系統(tǒng)需要層層翻文件夾找特定數(shù)據(jù),速度會變得非常慢。

相比于傳統(tǒng)的存儲模式,華為云推出的對象存儲服務(wù)(OBS)更能適應(yīng)當(dāng)下的數(shù)據(jù)需求。

對于企業(yè)來說,云服務(wù)可以實現(xiàn)理論上的“無限存”,只需要加服務(wù)器就能實現(xiàn)無限擴容。它存儲數(shù)據(jù)的方式也和前者不同,傳統(tǒng)的存儲用樹狀存儲,文件越多,越需要系統(tǒng)多層翻閱查找。

而對象存儲服務(wù)(OBS)的基本原理可以理解成是,用數(shù)據(jù)本身+表述數(shù)據(jù)類型的元數(shù)據(jù)+全局唯一的Key來描述一個存儲單元(對象)。簡單來說,OBS相當(dāng)于將冗雜的數(shù)據(jù)變成分類存儲的包裹,每個都加了標(biāo)簽和編號。

所以,OBS就像一個云端無限大的倉庫,企業(yè)不需要關(guān)心倉庫怎么建、怎么擴容,只需要往里扔數(shù)據(jù)就行。同時,因為OBS描述“對象”的獨特方式,這使得華為能提供高達99.9999999999%(12個9)的數(shù)據(jù)持久性和99.995%的服務(wù)可用性(SLA,總可用時間的占比)。

針對預(yù)算有限的中小企業(yè),華為云推出的 Flexus OBS 則是這個倉庫的“高性價比版”。它保留了核心的存儲功能和安全性,專門為需求數(shù)據(jù)歸檔、網(wǎng)站建設(shè)、內(nèi)容分發(fā)等場景的中小企業(yè)設(shè)計。據(jù)官方數(shù)據(jù),其最高可綜合降本20%。

圖片

總體來看,華為云等廠商提供的方案,本質(zhì)上是一整套從傳統(tǒng)IT架構(gòu)升級到云服務(wù)器的完整解決方案,節(jié)省硬件成本的同時,讓企業(yè)最大化地為有效算力買單。

上云,就是用云端服務(wù)的靈活性,去對抗硬件市場的長期漲價。這也是在2025年,企業(yè)保持競爭力的最優(yōu)解。

上云,迎戰(zhàn)硬件通脹時代

一個確定的事實是,只要AI技術(shù)還在不斷升級,持續(xù)融入千行百業(yè),那么硬件通脹時代就不會輕易結(jié)束。

在這樣的背景下,如果堅持選擇傳統(tǒng)IT架構(gòu),走“自建機房”和“傳統(tǒng)托管”的路子,無疑是在逆風(fēng)行走,而企業(yè)也不得不面對事倍功半的風(fēng)險。

當(dāng)被視為企業(yè)資產(chǎn)的IT硬件,正在轉(zhuǎn)變?yōu)橄拗破髽I(yè)現(xiàn)金流的“負債包袱”。此時,“上云”的價值,已經(jīng)不再局限于技術(shù)層面,更體現(xiàn)在金融屬性上——它是一種對抗硬件價格浮動的手段。

對于企業(yè)來說,通過購買云服務(wù),不僅將硬件的采購和折舊風(fēng)險轉(zhuǎn)移給了云廠商,也把構(gòu)建基礎(chǔ)設(shè)施的“隱形成本”——人力、電力和維護成本都一并抹除。而對于云廠商來說,靠著規(guī);(yīng),高效利用手中的資源,把使用成本壓縮到中小企業(yè)難以企及的價格范圍內(nèi),這對于企業(yè)來說,變成了一筆比之前性價比更高的支出。

不過,對于企業(yè)來說,如何將資源遷移到云上就成了問題,一旦出現(xiàn)數(shù)據(jù)丟失、軟件不兼容等問題,導(dǎo)致業(yè)務(wù)中斷,對于企業(yè)來說將得不償失。

如今,隨著云廠商工具鏈的成熟,這一技術(shù)門檻已被大幅削平。以華為云遷移中心(MgC)為例,作為一站式遷移平臺,它內(nèi)部集成了大量根據(jù)實踐總結(jié)的遷移工作流模版,包括主機大批量遷移模板、存儲數(shù)據(jù)遷移模板,用戶可以根據(jù)不同遷移場景做選擇。工具化的遷移方法論,大幅提升了遷移速度。據(jù)官方數(shù)據(jù)顯示,其幫助神州專車提升了40%遷移效率。

圖片

除了硬件成本控制,上云更核心的戰(zhàn)略意義,在于 “借力”,通過云廠商集成的先進技術(shù)和自身業(yè)務(wù)快速融合,從而搶占市場先機。

過往,企業(yè)自建IT架構(gòu)下的硬件采購、物流、上架調(diào)試通常需要數(shù)周甚至數(shù)月,而云端資源的獲取僅需分鐘級?坎渴鹚俣鹊奶嵘,企業(yè)能夠更快速地驗證新產(chǎn)品。

一個在AI時代更突出的特征是,云廠商已成為前沿技術(shù)的“集中地”。為了維持生態(tài)競爭力,云廠商通常會第一時間集成最新的AI大模型和AI應(yīng)用。對于企業(yè)而言,不需要自己再做一遍,就可以直接調(diào)用對應(yīng)的技術(shù)。

如今,上云已經(jīng)不僅是出于成本的防御性選擇,更是幫助企業(yè)轉(zhuǎn)型數(shù)智化、通往下一個時代的入場券。

       原文標(biāo)題 : 存儲通脹時代,企業(yè)IT如何尋找“避風(fēng)港”?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號