北京2022年6月9日 /美通社/ --
狹小,不到0.002立方米空間內(nèi);
氣流,被每秒500轉(zhuǎn)的風(fēng)扇擾動;
瞬間,所有電氣組件變?yōu)槟μ齑髽牵?br />極限,硬盤數(shù)據(jù)接近滿載;
此時,硬盤讀寫頭以10納米的距離,懸浮于盤片之上……
硬盤正在經(jīng)歷一項極致嚴(yán)苛的性能與可靠性測試——服務(wù)器工作環(huán)境溫度已經(jīng)超過數(shù)據(jù)中心環(huán)境溫度標(biāo)準(zhǔn),與此同時內(nèi)部一臺散熱風(fēng)扇停止工作,要求服務(wù)器仍然能正常運(yùn)轉(zhuǎn),硬盤的讀寫性能依舊在線,以保障在這類極小概率出現(xiàn)的業(yè)務(wù)場景中硬盤數(shù)據(jù)的安全,性能的穩(wěn)定。但在極限測試中,浪潮信息工程師發(fā)現(xiàn),在對于硬盤進(jìn)行接近滿載的高負(fù)荷壓力測試時,硬盤的穩(wěn)定性猶如在亂風(fēng)中飛舞的柳絮飄忽不定,甚至還出現(xiàn)了徹底報廢的極端故障。
面對數(shù)據(jù)中心數(shù)據(jù)計算量的幾何級增長,這種看似在罕見場景、極限測試才出現(xiàn)的故障問題,也不能輕易忽視,必須要找到"神隱"背后的問題根源。
尋找毫厘之間的玄謎!一個好消息、一個壞消息?
為了揭開硬盤讀寫性能下降的謎題,浪潮信息工程師首先針對服務(wù)器的關(guān)鍵組件進(jìn)行逐一篩查,替換了不同的風(fēng)扇、硬盤、內(nèi)部主板以及背部連接器等進(jìn)行對比分析,但問題依然存在。工程師又結(jié)合定量分析,改變環(huán)境溫度、調(diào)節(jié)風(fēng)扇轉(zhuǎn)速等等進(jìn)行了大量的實(shí)驗測試,終于發(fā)現(xiàn)每當(dāng)風(fēng)扇轉(zhuǎn)速達(dá)3萬轉(zhuǎn)/分鐘,服務(wù)器的硬盤讀寫性能就開始下降。
基于這一發(fā)現(xiàn),結(jié)構(gòu)仿真、流體仿真等多個團(tuán)隊協(xié)同合作,找到了問題的答案——當(dāng)散熱風(fēng)扇轉(zhuǎn)速達(dá)到3萬轉(zhuǎn)的極限轉(zhuǎn)速時,系統(tǒng)風(fēng)扇進(jìn)風(fēng)端形成的湍流,即氣流漩渦,會存在于硬盤和風(fēng)扇之間的空間,而硬盤是精密度很高的部件,對湍流信號感知非常敏感,不規(guī)則的湍流可能會給硬盤性能帶來巨大的影響。輕則影響硬盤磁頭讀寫性能下降,嚴(yán)重則會硬盤報廢,導(dǎo)致數(shù)據(jù)丟失。
引起"湍流"的散熱風(fēng)扇是保障服務(wù)器計算性能和散熱的核心部件之一,但極限轉(zhuǎn)速的風(fēng)扇所產(chǎn)生的"湍流"又會影響硬盤的性能和可靠性,浪潮信息工程師需要尋找性能與散熱極致平衡的方法,讓計算性能、散熱、可靠性達(dá)到和諧統(tǒng)一。
問題雖然得已鎖定,但工程師們欣喜之下,又不得不去面對一個壞消息——能否有效治理"湍流"是數(shù)學(xué)屆的千禧年7大難題之一。浪潮信息工程師要做的就是尋找破解風(fēng)扇高速轉(zhuǎn)動而產(chǎn)生湍流效應(yīng)的方法。
破解"湍流" 意外破"圈"帶來驚喜
想要有效的破解"湍流",就意味著要讓雜亂的"湍流"變成平穩(wěn)的"層流"。在項目組百思不得其解的時候,浪潮信息工程師在參與FAST天眼項目現(xiàn)場,看到天眼采用的濾波材料突然有了靈感。工程師開始嘗試引入一種濾波材料,通過對氣流進(jìn)行導(dǎo)流,讓隨性的風(fēng)走直線,破解湍流造成的硬盤性能影響。
PS:H.Tennekes&J.L. Lumley 曾對湍流進(jìn)行過評論:嘗試解決湍流問題的成功與否,強(qiáng)烈地取決于包括做出關(guān)鍵性假設(shè)的靈感。 湍流需要奔放的發(fā)明者,正如需要專業(yè)分析師那么重要。
這一濾波材料的形狀要如何確定呢?工程師們嘗試了多種不同的形狀,效果都不理想。在一次偶然的出差中,深圳機(jī)場六邊形的蜂窩結(jié)構(gòu)的設(shè)計又給工程師帶來了靈感,六邊形蜂窩狀結(jié)構(gòu),省材料,夠堅固,通風(fēng)量也最好,工程師們將其引入M6服務(wù)器設(shè)計,進(jìn)行仿真測試,設(shè)計出了波導(dǎo)網(wǎng)——鋁制六邊形蜂巢網(wǎng),它能夠破解湍流,引導(dǎo)風(fēng)流直吹,同時在厚度上不足0.2mm,確保了進(jìn)風(fēng)處的最大通風(fēng)量,重量也僅11克左右。
這一結(jié)構(gòu)可以將不規(guī)則的湍流切割成平穩(wěn)的層流。經(jīng)過高頻度仿真測試協(xié)同,浪潮信息工程師為M6旗下每一款服務(wù)器的波導(dǎo)網(wǎng)蜂巢單元尺寸進(jìn)行了科學(xué)匹配,定制出最佳孔徑、厚度大小的波導(dǎo)網(wǎng)。與此同時,工程師還借鑒了"音樂廳"降低噪聲的方法,在波導(dǎo)網(wǎng)周圍貼附上吸音海綿,進(jìn)一步降低噪音對硬盤和機(jī)箱共振的干擾。
波導(dǎo)網(wǎng),一個小的改變,化解了硬盤極限壓力危機(jī),然而,收獲并未就此停止,數(shù)據(jù)顯示,通過采用波導(dǎo)網(wǎng),M6服務(wù)器的硬盤性能提升:6%-8%;服務(wù)器散熱效率提升:17%-22%;數(shù)據(jù)中心可節(jié)約能耗:6%-8%。
相對于計算技術(shù)的創(chuàng)新而言,波導(dǎo)網(wǎng)可能只能算是微創(chuàng)新,但往往細(xì)節(jié)決定成敗,微小的進(jìn)步的累積,會引導(dǎo)風(fēng)向,也會引動風(fēng)潮。