北京2022年10月26日 /美通社/ -- 從智能網(wǎng)卡的出現(xiàn),到DPU在云基礎(chǔ)設(shè)施領(lǐng)域的興起,其所涉及到的芯片、產(chǎn)品以及云服務(wù)等多個(gè)領(lǐng)域的提供商,對(duì)于智能網(wǎng)卡的解讀也越加豐富。與此同時(shí),伴隨DPU的不斷迭代升級(jí),進(jìn)一步引發(fā)了整個(gè)產(chǎn)業(yè)對(duì)于IT基礎(chǔ)架構(gòu)體系未來(lái)演進(jìn)方向的熱烈探討。
在由高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室與開放計(jì)算中國(guó)社區(qū)聯(lián)合主辦的"第六期開放計(jì)算技術(shù)沙龍:網(wǎng)絡(luò)技術(shù)研究與實(shí)踐"線上研討會(huì)中,來(lái)自阿里云神龍計(jì)算平臺(tái)、中國(guó)電子云、NVIDIA、矩向科技以及網(wǎng)絡(luò)、芯片領(lǐng)域的合作伙伴、專家,圍繞DPU的價(jià)值、作用以及未來(lái)發(fā)展方向,進(jìn)行了充分解讀。
DPU 使數(shù)據(jù)中心性能提升 開放全新"視野"
DPU作為數(shù)據(jù)處理單元,它在網(wǎng)絡(luò)計(jì)算領(lǐng)域中正扮演著關(guān)鍵角色。借助DPU,傳統(tǒng)通信方式中所存在的網(wǎng)絡(luò)擁塞及主機(jī)CPU資源被大量消耗的問題有望得到有效解決。同時(shí),它還能夠有效應(yīng)對(duì)多租戶應(yīng)用性能隔離的難題。
NVIDIA網(wǎng)絡(luò)高級(jí)總監(jiān)宋慶春介紹到,DPU作為NVIDIA "云原生超級(jí)計(jì)算架構(gòu)"中的重要一員,使計(jì)算平臺(tái)、網(wǎng)絡(luò)、存儲(chǔ)均成為計(jì)算單元,實(shí)現(xiàn)了在一個(gè)數(shù)據(jù)中心里,數(shù)據(jù)在哪里,計(jì)算就在哪里。如此也就實(shí)現(xiàn)了在一個(gè)統(tǒng)一的架構(gòu)下面,無(wú)論是像AI訓(xùn)練這樣的大規(guī)模應(yīng)用,還是非常小的一些基于VM實(shí)現(xiàn)的應(yīng)用,租戶都可以使其性能達(dá)到最大化。
宋慶春通過(guò)一組數(shù)據(jù),展現(xiàn)了DPU給用戶所帶來(lái)的收益。iAlltoall是HPC、AI應(yīng)用過(guò)程中會(huì)經(jīng)常采用的一種通信模型,通過(guò)用DPU和CPU實(shí)現(xiàn)計(jì)算通信Overlap,讓iAlltoall性能得到44%提升。iAllgather是AI大規(guī)模模型訓(xùn)練過(guò)程中會(huì)使用的一個(gè)通信模型,通過(guò)DPU和CPU計(jì)算通信的Overlap,能夠讓iAllgather性能提升36%。
面對(duì)DPU在超大規(guī)模云數(shù)據(jù)中心領(lǐng)域被逐漸廣泛接受的現(xiàn)狀,矩向科技創(chuàng)始人黃朝波指出當(dāng)下的DPU演進(jìn)還在持續(xù)當(dāng)中。黃朝波認(rèn)為,伴隨著Chiplet等技術(shù)的成熟,在邊緣計(jì)算和企業(yè)云等規(guī)模更大、計(jì)算負(fù)載輕量的一些場(chǎng)景中,CPU、GPU和DPU會(huì)融合成一顆芯片,市場(chǎng)上將會(huì)出現(xiàn)超異構(gòu)處理器——HPU產(chǎn)品。
智能網(wǎng)卡演進(jìn) 促動(dòng)數(shù)據(jù)中心體系架構(gòu)創(chuàng)新
面對(duì)業(yè)界對(duì)于SmartNIC、DPU、IPU抑或是新進(jìn)"登場(chǎng)"的CIPU的廣泛關(guān)注,中國(guó)電子云研發(fā)副總裁劉年超認(rèn)為,智能網(wǎng)卡雖然在命名方式方面缺乏統(tǒng)一的標(biāo)準(zhǔn),但它的出現(xiàn)反映出一種趨勢(shì),以CPU為中心的體系架構(gòu),正在發(fā)生新的變化。
新一代 DPU/IPU 設(shè)備的共同特點(diǎn)是它們采用易于編程的多核CPU、先進(jìn)的網(wǎng)絡(luò)接口以及一組強(qiáng)大的網(wǎng)絡(luò)、存儲(chǔ)和安全加速器,并可以進(jìn)行編程以執(zhí)行多個(gè)軟件定義的硬件加速功能。劉年超認(rèn)為,這不僅在技術(shù)層面實(shí)現(xiàn)了對(duì)Host CPU計(jì)算性能的卸載,同時(shí)對(duì)于云服務(wù)商而言,DPU的應(yīng)用能夠讓云服務(wù)商有更多可進(jìn)行銷售的產(chǎn)品或服務(wù),提升了主機(jī)CPU的對(duì)外售賣能力。
在大規(guī)模部署過(guò)程中,劉年超認(rèn)為,DPU作為一個(gè)"小系統(tǒng)",對(duì)它的運(yùn)維和管理也顯得尤為重要。中國(guó)電子云通過(guò)獨(dú)立的BMC,面對(duì)不同用戶的實(shí)際應(yīng)用場(chǎng)景,均可實(shí)現(xiàn)對(duì)DPU網(wǎng)卡的直接管理。
在過(guò)去5年的DPU研發(fā)迭代過(guò)程中,阿里云愈加意識(shí)到自身的數(shù)據(jù)中心架構(gòu)正在發(fā)生新的變化。阿里云神龍計(jì)算平臺(tái)負(fù)責(zé)人蔣林泉認(rèn)為阿里云的新架構(gòu)有可能不再以CPU為核心,它更需要借助以阿里云自主研發(fā)的CIPU(Cloud Infrastructure Processing Unit)為中心,連接起SSD、RDMA,CPU、GPU和其他異構(gòu)計(jì)算設(shè)備。這一點(diǎn)已經(jīng)在阿里云自研的云操作系統(tǒng)——飛天的一步步演進(jìn)過(guò)程中得到了驗(yàn)證。阿里云已經(jīng)認(rèn)識(shí)到,當(dāng)初的智能網(wǎng)卡已經(jīng)不再是插在服務(wù)器上的一張網(wǎng)卡。在未來(lái),它的物理形態(tài)很有可能還會(huì)發(fā)生變化。
面對(duì)智能網(wǎng)卡以及DPU的技術(shù)演進(jìn)特點(diǎn),為了確保用戶在智能網(wǎng)卡的應(yīng)用實(shí)踐過(guò)程中,最大限度降低試錯(cuò)成本、契合應(yīng)用場(chǎng)景的實(shí)際需求,浪潮網(wǎng)絡(luò)在智能網(wǎng)卡解決方案的制定過(guò)程中,從軟、硬件層面充分考慮了不同規(guī)模、不同IT技術(shù)能力儲(chǔ)備的企業(yè)用戶需求。
針對(duì)IT能力儲(chǔ)備有限的傳統(tǒng)企業(yè),浪潮網(wǎng)絡(luò)提供完備的軟硬件一體化智能網(wǎng)卡方案,為上層應(yīng)用提供標(biāo)準(zhǔn)的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)卸載和加速服務(wù),簡(jiǎn)化與主機(jī)軟件的集成,幫助客戶快速獲取智能網(wǎng)卡的技術(shù)紅利。從而降低最終用戶在網(wǎng)絡(luò)應(yīng)用開發(fā)和運(yùn)維管理等方面的技術(shù)門檻。對(duì)于大型互聯(lián)網(wǎng)、電信以及金融行業(yè),浪潮網(wǎng)絡(luò)不僅提供了相應(yīng)的技術(shù)支持服務(wù),在產(chǎn)品線上也提供了業(yè)界領(lǐng)先,具備集成2個(gè)25GE或1個(gè)100GE以太網(wǎng)口,與主機(jī)端實(shí)現(xiàn)PCIe 4.0高速連接的N20X智能網(wǎng)卡。
浪潮網(wǎng)絡(luò)智能網(wǎng)卡具備三大性能優(yōu)勢(shì):
與此同時(shí),智能網(wǎng)卡的應(yīng)用需求正在從超算平臺(tái)、超大規(guī)模數(shù)據(jù)中心,逐漸向邊緣數(shù)據(jù)中心滲透。這種趨勢(shì)更加凸顯出云邊協(xié)同對(duì)于構(gòu)建開放網(wǎng)絡(luò)的重要性。浪潮網(wǎng)絡(luò)所打造的云邊協(xié)同智慧聯(lián)接架構(gòu),在云中心側(cè)以領(lǐng)先的開放網(wǎng)絡(luò)平臺(tái)為核心,打造高性能、低成本、彈性可擴(kuò)展的解決方案,使新業(yè)務(wù)上線時(shí)間縮短20%,提升排障效率30%,實(shí)現(xiàn)秒級(jí)網(wǎng)絡(luò)業(yè)務(wù)調(diào)整,滿足云業(yè)務(wù)彈性、敏捷擴(kuò)展的需求。在邊緣側(cè),浪潮網(wǎng)絡(luò)通過(guò)新一代邊緣網(wǎng)絡(luò)平臺(tái),融合傳統(tǒng)有線、無(wú)線網(wǎng)絡(luò),以及Zigbee、LoRa等終端網(wǎng)絡(luò),打造低延遲、實(shí)時(shí)可靠的邊緣網(wǎng)絡(luò),實(shí)現(xiàn)網(wǎng)絡(luò)的智能可視化調(diào)度,將網(wǎng)絡(luò)傳輸力提升27%、算力利用率提升30%。目前,浪潮網(wǎng)絡(luò)的云邊協(xié)同智慧聯(lián)接架構(gòu)已在政府、教育、醫(yī)療、制造等諸多行業(yè)得到廣泛部署和應(yīng)用。
對(duì)于智能網(wǎng)卡、DPU技術(shù)及產(chǎn)品的長(zhǎng)期研發(fā)、推廣,體現(xiàn)出浪潮網(wǎng)絡(luò)以產(chǎn)品創(chuàng)新為引擎的技術(shù)實(shí)力。浪潮網(wǎng)絡(luò)通過(guò)云邊協(xié)同的智慧網(wǎng)絡(luò),實(shí)現(xiàn)云、邊、端的智慧聯(lián)接、資源調(diào)度,為數(shù)據(jù)賦能,推動(dòng)行業(yè)的數(shù)字化、智能化發(fā)展。