如今,數(shù)據(jù)中心可謂是數(shù)字經(jīng)濟(jì)的基礎(chǔ)。每一條微博動態(tài)、微信消息和抖音視頻上傳都依賴于數(shù)據(jù)中心。沒有數(shù)據(jù)中心,就不會有網(wǎng)友追更的網(wǎng)劇、日常導(dǎo)航的地圖和便捷的移動支付,各類藥物的研發(fā)工作也將明顯放慢腳步。盡管數(shù)據(jù)中心對于我們今天生活的世界至關(guān)重要,但它們的運(yùn)行也不能夠與環(huán)境的可持續(xù)發(fā)展相向而行。日前,《中國環(huán)境報》刊文指出,2021年全國數(shù)據(jù)中心能源消耗達(dá)到2166億千瓦時,較2020年增加44%,約占全年總用電量2.6%,也相當(dāng)于2021年湖南全省的用電量,且能耗增速高于數(shù)據(jù)中心機(jī)架增長速度。同時,也有預(yù)測顯示,2025年中國數(shù)據(jù)中心耗電將占社會總用電量4%。因此,數(shù)據(jù)中心的綠色轉(zhuǎn)型和節(jié)能減排具有十分重要的意義。
一般情況下,數(shù)據(jù)中心的節(jié)能可以通過適度調(diào)高環(huán)境溫度、及時淘汰陳舊設(shè)施、虛擬化技術(shù)的應(yīng)用,以及充分利用自然散熱等方式實現(xiàn)。這些方式大多把算力需求帶來的電力負(fù)荷作為剛性負(fù)荷,把焦點集中在供能系統(tǒng)等非服務(wù)器設(shè)備,重點關(guān)注配置儲能、優(yōu)化供冷系統(tǒng)調(diào)節(jié)等。而細(xì)觀數(shù)據(jù)中心用電結(jié)構(gòu)就會發(fā)現(xiàn),服務(wù)器才是耗電“大戶”,以PUE(Power Usage Effectiveness,數(shù)據(jù)中心總能耗/IT設(shè)備能耗)值為1.3的數(shù)據(jù)中心為例,服務(wù)器耗電占比77%。因此,尋找調(diào)節(jié)服務(wù)器的算力和電力負(fù)荷的方式,將能發(fā)揮出數(shù)據(jù)中心的巨大電力靈活性潛力。在近日舉行的2022騰訊數(shù)字生態(tài)大會上,騰訊表示其正攜手英特爾,基于英特爾? 數(shù)據(jù)中心管理平臺(Intel? Data Center Management, Intel? DCM),對綠色數(shù)據(jù)中心需求側(cè)響應(yīng)進(jìn)行深入研究。
所謂電力需求響應(yīng),指的是通過判斷計算任務(wù)在服務(wù)器上的算力-電力特征,在不影響業(yè)務(wù)運(yùn)行的情況下,降低電力部件的實時冗余性、調(diào)整業(yè)務(wù)負(fù)載的并行規(guī)模和時間分布,達(dá)到降低、平移、伸縮數(shù)據(jù)中心服務(wù)器的用電負(fù)荷,形成“算力跟隨電力”的特性,從而實現(xiàn)節(jié)能降耗、對電網(wǎng)負(fù)荷削峰填谷等目的。
為此,騰訊已與英特爾等合作伙伴對三種策略進(jìn)行了探索,其中包括利用空載服務(wù)器功耗切換、利用服務(wù)器硬件資源消耗不均衡性,以及平移和伸縮實時性不敏感任務(wù)的方案。具體來說,第一種方案利用了數(shù)據(jù)中心中部分服務(wù)器處于并未執(zhí)行任何工作而空載備用的現(xiàn)實,通過業(yè)務(wù)規(guī)模的精細(xì)預(yù)測,對服務(wù)器執(zhí)行不同方式的功率降低和休眠策略,可實現(xiàn)不同級別的響應(yīng)速度和響應(yīng)深度,使其成為數(shù)據(jù)中心節(jié)能的重要途徑。測試數(shù)據(jù)顯示通過切換服務(wù)器空載狀態(tài),三種模式皆可獲得功率降低。其中,F(xiàn)reeze、PowerCap皆可秒級響應(yīng),功率降比分別為4%、27%;關(guān)機(jī)帶來的功率降低最大,最高可達(dá)100%。
相比于利用空載服務(wù)器功耗切換,第二種方式則通過研究一系列的特性數(shù)據(jù),尋找導(dǎo)致性能使用密集的子部件及因此產(chǎn)生能力冗余的其余部件,通過降低冗余的子部件性能,可以在不影響業(yè)務(wù)負(fù)載運(yùn)行效率的情況下,降低電力負(fù)荷。測試數(shù)據(jù)顯示,在執(zhí)行硬盤密集型任務(wù)時,可將CPU 功率由215 W壓縮至160W,降比達(dá)26%。而在執(zhí)行內(nèi)存密集型任務(wù)時,內(nèi)存占用越高,CPU功率可壓縮空間則越大。
最后,第三種方式針對日益增長的高性能計算需求及具有計算成本敏感、實時性不敏感、計算規(guī)??勺儎犹匦缘墓ぷ髫?fù)載,對并行算法和并行軟件設(shè)計加以改良。一方面通過實時傳遞價格信號,激勵用戶選擇電力價格較低的時間段進(jìn)行整體運(yùn)算;另一方面,通過斷點續(xù)算、可續(xù)渲染技術(shù),在計算任務(wù)執(zhí)行的過程中暫停乃至對并行規(guī)模進(jìn)行改變,來平移和升降電力負(fù)荷。各類型并行計算的測試結(jié)果表明,縮容、擴(kuò)容、平移等計算節(jié)奏調(diào)整雖然不會顯著影響總耗電量和總時長,但這一策略可根據(jù)電網(wǎng)響應(yīng)邀約時段和負(fù)荷調(diào)節(jié)要求,靈活改變算力分布,達(dá)到“削峰填谷”的目的。
在數(shù)字經(jīng)濟(jì)快速發(fā)展、社會能源消耗節(jié)節(jié)攀升的今天,上述研究無疑為綠色數(shù)據(jù)中心的建設(shè)與可持續(xù)發(fā)展的未來指明了新的方向。這不僅是騰訊碳中和規(guī)劃中的重要一環(huán),也將作為重要科技成果,在本月底的聯(lián)合國氣候變化大會上進(jìn)行展示。
作為云計算產(chǎn)業(yè)生態(tài)的最佳合伙人,英特爾與騰訊的“牽手”并未止步于此——在2022騰訊數(shù)字生態(tài)大會上,騰訊也正式了發(fā)布基于第四代英特爾?至強(qiáng)?可擴(kuò)展處理器(代號Sapphire Rapids)的第七代云服務(wù)器實例S7/M7。這也是繼騰訊云星星海自研四路服務(wù)器和騰訊云星星海 XC221 計算型服務(wù)器之后,雙方攜手在數(shù)據(jù)中心服務(wù)器領(lǐng)域帶來的又一重磅升級。
得益于第四代英特爾?至強(qiáng)?可擴(kuò)展處理器的強(qiáng)勁算力,該全新云實例實現(xiàn)了較高的性能提升。而在騰訊云星星海自研服務(wù)器與銀杉自研智能網(wǎng)卡的加持下,S7/M7也實現(xiàn)了性能、安全和可靠性的全面增強(qiáng)。英特爾與騰訊在這一實例上的合作不僅將持續(xù)提升云產(chǎn)品性能,也通過軟硬協(xié)同推進(jìn)的方式實現(xiàn)算力成本優(yōu)化,助力客戶應(yīng)用降本增效,為進(jìn)一步打造兼?zhèn)涓咝阅芎透呖捎锰匦缘膬?yōu)質(zhì)云服務(wù)奠定了堅實基礎(chǔ)。
此外,在混合云解決方案領(lǐng)域,基于英特爾?至強(qiáng)?可擴(kuò)展處理器、系統(tǒng)集成芯片(SoC)和FPGA,以及英特爾?傲騰?持久內(nèi)存的新一代騰訊云TCE一體機(jī)實現(xiàn)了針對計算、網(wǎng)絡(luò)、存儲與監(jiān)控運(yùn)維的全面升級;在SaaS、視頻與AI、數(shù)據(jù)服務(wù)以及云原生等領(lǐng)域的多個產(chǎn)品線上,雙方全棧式的軟硬件合作助力騰訊云實現(xiàn)了針對云上推薦系統(tǒng)、矩陣乘、機(jī)器視覺、語音過濾以及自然語言模型(BERT)的全方位AI優(yōu)化;而基于第四代英特爾?至強(qiáng)?可擴(kuò)展處理器的AMX-VNNI指令集,騰訊云得以大幅提升視頻增強(qiáng)性能,優(yōu)化視頻前處理和轉(zhuǎn)碼速度并極大降低運(yùn)維成本……
當(dāng)今時代,有人把云計算技術(shù)視為個人電腦、互聯(lián)網(wǎng)之后的第三次革新浪潮,認(rèn)為它即將甚至已經(jīng)從根本上改變整個信息產(chǎn)業(yè)的格局,改變?nèi)祟愂褂糜嬎銠C(jī)的習(xí)慣和方式,因此,云計算技術(shù)得到了迅猛發(fā)展。在短短15年內(nèi),全球整體云計算市場規(guī)模從零增長到2021年的7050億美元。這樣的發(fā)展不僅從日益增長的行業(yè)與社會需求中汲取動能,更離不開如騰訊與英特爾的長期投入與堅定創(chuàng)新。中國作為全球云計算市場中增長最快的區(qū)域,伴隨著老朋友與新伙伴的持續(xù)合作和不斷壯大的產(chǎn)業(yè)生態(tài),也必將迎來下一個更加蓬勃的發(fā)展期。