ZD至頂網(wǎng)網(wǎng)絡(luò)頻道 06月27日 北京報道:由于每天都在服務(wù)千萬甚至以億級別計算的用戶數(shù),中國的電信運營商的網(wǎng)絡(luò)可以說是最繁忙的計算環(huán)境之一。運營商的IT系統(tǒng)也都每分每秒在接受著業(yè)務(wù)的嚴苛考驗。同時,運營商的業(yè)務(wù)也在發(fā)生變化,除了語音服務(wù),運營商正在提供越來越多的數(shù)據(jù)和流量服務(wù),甚至是云計算服務(wù)。這就反過來要求運營商的底層技術(shù)架構(gòu)也要實時演化。
中國移動蘇州研發(fā)中心(以下簡稱:蘇研)是中國移動專門為云計算、物聯(lián)網(wǎng)相關(guān)研發(fā)而設(shè)立的機構(gòu)。該機構(gòu)成立于2014年7月,主要負責云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)、以及IT技術(shù)支撐系統(tǒng)等相關(guān)技術(shù)研發(fā),在中國移動的整體產(chǎn)品研發(fā)結(jié)構(gòu)中也處在頂層設(shè)計階段。因此蘇研對大型數(shù)據(jù)中心和底層技術(shù)實踐的思考對外界有很強的借鑒意義。
為此,ZD至頂網(wǎng)總編輯高飛與中國移動蘇州研發(fā)中心云計算產(chǎn)品部副總經(jīng)理張志宏進行獨家對話。在采訪中,張志宏分別從軟件定義、開源,以及云計算的多個角度闡述了未來IT系統(tǒng)的發(fā)展規(guī)律,并以中國移動為例,從底層計算、存儲、網(wǎng)絡(luò),再到上層管理平臺的整體體系構(gòu)成,進行了詳盡的分享。
在張志宏看來,談及云計算的目標就是要快速、按需的去交付服務(wù),這勢必需要通過軟件來實現(xiàn)IT系統(tǒng)的靈活性, “今天的云計算必然要用到軟件定義的相關(guān)技術(shù)。在未來,包括計算、存儲、網(wǎng)絡(luò)在內(nèi)都將實現(xiàn)軟件化。”
先有軟件定義再有云計算
軟件定義基礎(chǔ)架構(gòu)分為計算,存儲,網(wǎng)絡(luò)等多個方面。不同行業(yè)和企業(yè)對如何分階段實時這些技術(shù)存在不同的理解。張志宏認為,從工程實現(xiàn)的角度,軟件定義計算(SDC)和軟件定義存儲(SDS)是相對來說比較容易,而且也有比較好的軟件支持平臺,即OpenStack。根據(jù)Intel之前一份關(guān)于SDI技術(shù)報告的觀點:在 2016 年之前,企業(yè) IT 部門通常在概念驗證部署中使用 OpenStack。蘇研則驗證了這一觀點,甚至走的更加靠前,很早就部署了OpenStack。從實踐情況來看, 這項技術(shù)也發(fā)揮了很大作用,尤其是通過軟件方式解決各種異構(gòu)虛擬化平臺間的兼容問題。
張志宏以存儲舉例,不同的存儲模式,如分布式文件系統(tǒng)、分布式塊存儲、分布式對象存儲等,接口都不一樣。但對存儲底層實現(xiàn)軟件化之后,通過OpenStack平臺就能夠?qū)Σ煌愋偷拇鎯軜?gòu)進行統(tǒng)一管理。“特別是目前出現(xiàn)的分布式存儲,本身完全就是通過軟件實現(xiàn)的,所以從趨勢上看,基于軟件的分布式存儲必然會替代傳統(tǒng)盤陣設(shè)備。從這個角度看,軟件定義本身實際上也是由業(yè)務(wù)需求所自然形成的。”
除了SDS和SDC,對于運營商而言,軟件定義網(wǎng)絡(luò)(SDN)是非常重要的另一環(huán),如Open Flow等技術(shù)的出現(xiàn),打開了一扇通往底層流量控制的大門。不過張志宏表示,“目前通過SDN去控制虛擬交換機的方式,由于軟件和硬件之間耦合度還是比較高,像中國移動現(xiàn)網(wǎng)里用的很多設(shè)備,包括NFV、虛擬防火墻、虛擬交換機、虛擬服務(wù)器、負載均衡等,都要通過廠商專有的SDN平臺去控制,實際上在很多方面并沒有非常開放,所以我們希望今后軟件定義網(wǎng)絡(luò)(SDN)能夠進一步得到規(guī)范。”
盡管還存在一些應(yīng)用挑戰(zhàn),但總體來說軟件定義的潮流不可逆轉(zhuǎn)。張志宏提到, OpenStack本身就是一個典型的軟件化成功案例,它利用插件的模式,將云計算中,包括計算、存儲和網(wǎng)絡(luò)在內(nèi)的體系架構(gòu)進行了統(tǒng)一,從而讓任意功能都能夠更容易的整合到開源平臺中去,當前大部分基于OpenStack的云計算平臺,也都是以開源技術(shù)為基礎(chǔ)利用軟件定義的架構(gòu)去實現(xiàn)的。另外從業(yè)界的主流觀點來看,目前現(xiàn)有X86架構(gòu)在底層可以很好的支持面向軟件定義的資源管理,如利用SDN及NFV技術(shù)及標準化接口,優(yōu)化底層硬件設(shè)備和通信軟件的IT資源,而類似DPDK、Quick Assist等技術(shù)所具備的可擴展和業(yè)務(wù)編排能力,還進一步加強了運營商的業(yè)務(wù)優(yōu)化能力。
開源、軟件定義、自主研發(fā):一個都不能少
在采訪中,張志宏非常詳細的就蘇研的情況,從計算、存儲、網(wǎng)絡(luò)、安全、管理等多個維度闡述了中國移動云計算的技術(shù)體系。
據(jù)悉,這個體系底層服務(wù)器全部采用了X86體系架構(gòu),而云計算產(chǎn)品則基于底層自主定制的Linux操作系統(tǒng)進行開發(fā)。對資源層的虛擬化主要是在OpenStack架構(gòu)的基礎(chǔ)上自主研發(fā),蘇研有一個Linux團隊,專門負責底層操作系統(tǒng)的開發(fā)工作。在存儲方面則有三款產(chǎn)品,包括塊存儲、對象存儲,以及文件系統(tǒng),都基于開源系統(tǒng)自主研發(fā)。張志宏表示,“中國移動的存儲產(chǎn)品都已經(jīng)通過了OpenStack的框架,主要包括KVM等。但在中國移動的現(xiàn)網(wǎng)中,也還大量應(yīng)用像VMware、思杰,微軟的Hyper-V等產(chǎn)品,目前這些不同廠商產(chǎn)品都實現(xiàn)了在OpenStack平臺上的統(tǒng)一管理,所以軟件定義計算(SDC)在中國移動的IT系統(tǒng)中實現(xiàn)起來難度并不很大。”
在網(wǎng)絡(luò)方面,中國移動制定了兩種策略,對于200個節(jié)點以下較小規(guī)模的應(yīng)用場景,采用OpenStack原生的開源體系進行實現(xiàn)。而對于需要上千節(jié)點的大型應(yīng)用場景,中國移動采用了第三方設(shè)備商提供的SDN專業(yè)解決方案進行實現(xiàn)。張志宏表示,“OpenStack在設(shè)計上可能還有一些問題,所以我們主要應(yīng)用在較小規(guī)模的場景中。而在一些大型場景中我們還是積極采用了第三方廠商的SDN解決方案,其中包括華為、中興、華三、上海貝爾等在內(nèi)的多種方案,目前這些方案都已經(jīng)得到了中國移動的商用驗證,基于OpenStack接口標準,對整個業(yè)務(wù)流程可以做到統(tǒng)一管控。”
在安全方面,中國移動目前有一系列的安全產(chǎn)品,包括IDS、防火墻等產(chǎn)品主要也都是通過軟件方式來實現(xiàn)。另外,中國移動基于Docker容器技術(shù)開發(fā)了一款數(shù)據(jù)中心操作系統(tǒng),張志宏表示,“這一體系實際是用來解決中國移動現(xiàn)有的一些業(yè)務(wù)問題,比如IT系統(tǒng)向云遷移、細化等工作。而容器技術(shù)的優(yōu)勢在于,它相比虛擬化能夠更快速的去部署網(wǎng)絡(luò),提高資源利用率,而這套體系也是基于開源的。”
在管理平臺方面,中國移動有一套能夠跨資源池進行管理的平臺,叫做BCOP,它主要負責對整個云平臺,包括服務(wù)、門戶、運營在內(nèi)的多個平臺的統(tǒng)一管理工作,具備跨資源池的管理能力。此外,中國移動還在為公有云建立南方基地,在廣州已經(jīng)擁有相當數(shù)量的服務(wù)器,之后還會在北方的哈爾濱、長沙等地建立更多的數(shù)據(jù)中心。張志宏表示,“每一個數(shù)據(jù)中心在我們的架構(gòu)中都可以被視為一個資源池,這些資源池里面除了計算、存儲、網(wǎng)絡(luò)是基于軟件方式來實現(xiàn)的以外,中國移動還專門部署了一個叫Clould Master的管理平臺,負責對整個資源池的運維工作。”
從以上情況來看,中國移動的技術(shù)體系基本都涉及到了軟件定義和開源的相關(guān)技術(shù),同時進行了大量的針對自身需求自主開發(fā)。當然,這也和蘇研強大的技術(shù)研發(fā)能力密不可分。
未來的數(shù)據(jù)中心是一個“智子”
談及對未來IT軟硬件技術(shù)架構(gòu)的發(fā)展。在數(shù)據(jù)中心層面,張志宏認為,現(xiàn)在數(shù)據(jù)中心還是一個非常龐大的設(shè)施,而未來數(shù)據(jù)中心很可能將具備高度智能化,也會應(yīng)用量子計算等技術(shù),這會完全顛覆對現(xiàn)在對數(shù)據(jù)中心的一般認知。到那時,將不會存在計算資源匱乏的情況,計算資源可以更加敏捷和靈活的交付(因此也不存在浪費和被硬件設(shè)備所限制)。
在運維管理層面,張志宏表示,將來在運維工作中會大量采用人工智能(結(jié)合軟件定義)、認知計算、大數(shù)據(jù)等技術(shù),來實現(xiàn)高度自動化的運維。
據(jù)介紹,中國移動蘇州研發(fā)中心目前已經(jīng)開展了一些智能化的初步嘗試,蘇研的大數(shù)據(jù)部門通過一個日志分析系統(tǒng),并結(jié)合大數(shù)據(jù)等資源,能夠?qū)φ麄€云平臺中所有日志進行統(tǒng)一的智能分析,并對故障與故障相關(guān)信息進行時間、空間的進一步關(guān)聯(lián)分析。
在未來,一個終極的數(shù)據(jù)中心會是什么樣子?張志宏給出了一個非常富有想象力的回答。 “未來數(shù)據(jù)中心或許會包括量子計算在內(nèi),體積應(yīng)該像《三體》里面的‘智子’那么小,但卻具備強大的計算能力。這或許就是一個未來世界中的數(shù)據(jù)中心的面貌。”