有分析人士判斷,AI市場將會迎來一波長達(dá)十年以上的熱潮,AIGC在企業(yè)IT中的占比投入一定會越來越高,AI對于需求的刺激將是之前10年的10倍-100倍,算力需求也將隨之出現(xiàn)等量的增長。
以目前常見的幾類AI用例需求而言,很多高校進(jìn)行的傳統(tǒng)科學(xué)計(jì)算類應(yīng)用就需要HPC,才能完成如仿真、模擬、洋流預(yù)測、基因檢測等工作;對于傳統(tǒng)的政務(wù)云業(yè)務(wù)、傳統(tǒng)CRM/ERP企業(yè)數(shù)字化應(yīng)用則屬于傳統(tǒng)云計(jì)算需求,就需要調(diào)用CPU類資源;目前大熱的涉及道路識別、車牌識別這樣的智慧城市類應(yīng)用則需要調(diào)用GPU的能力。業(yè)務(wù)的多元需求恰恰決定了對于多元算力的需求。
“投資建設(shè)一個(gè)平臺后產(chǎn)生的效益取決于平臺能力,因?yàn)槠脚_能力越強(qiáng),能支撐客戶的業(yè)務(wù)種類就越多。客戶越多,盈利模式越清晰?!眳⑴c服務(wù)國家超算濟(jì)南中心的青云科技(qingcloud.com)CEO林源向媒體解釋了緣何需要異構(gòu)計(jì)算與多元算力。
據(jù)悉,三年前國家超算濟(jì)南中心就已經(jīng)擁有1000P算力與300PB以上的存儲,是當(dāng)時(shí)全亞洲最大的算力中心之一,包括了HPC超算、以CPU為主的傳統(tǒng)云計(jì)算,以GPU為主的智算,其中智算兼顧了國產(chǎn)化需求,引入了一部分國產(chǎn)GPU,進(jìn)而成為了一個(gè)既擁有多元算力,又具備異構(gòu)算力能力的超算中心。
“我們已經(jīng)在國家超算濟(jì)南中心的實(shí)踐成功,證明青云平臺具備能力、干過,也干成了?!绷衷磳iT表達(dá)了對于該產(chǎn)品的信心。青云AI智算平臺作為計(jì)算中心運(yùn)營者的關(guān)鍵工具,可以建立從建設(shè)到運(yùn)營的閉環(huán),在國家超算濟(jì)南中心的案例中,不僅三年前就成功進(jìn)行了實(shí)踐,還助力其不僅運(yùn)營得好,還實(shí)現(xiàn)了盈利。
青云AI算智算平臺可實(shí)現(xiàn)對于GPU算力、HPC算力、多存儲系統(tǒng)、模型資源、數(shù)據(jù)資源的多元資源統(tǒng)一平臺管理,實(shí)現(xiàn)算力平臺自動資源。還可根據(jù)不同的行業(yè)需求,通過平臺進(jìn)行資源分發(fā),具備分布式調(diào)度與管理能力,自動分配和管理算力資源,大幅縮短任務(wù)執(zhí)行時(shí)間,提高工作效率,讓客戶專注于業(yè)務(wù)創(chuàng)新和應(yīng)用開發(fā)。
平臺的管理操作也易如反掌,通過統(tǒng)一運(yùn)營和運(yùn)維管理平臺,實(shí)現(xiàn)多種服務(wù)場景的運(yùn)營化服務(wù)的后時(shí),規(guī)范化高效運(yùn)維,幫助用戶實(shí)現(xiàn)精細(xì)化運(yùn)營。青云會為平臺管理員交付一個(gè)可視化的大屏管理界面,可輕松瀏覽全國的上千臺算力資源與存儲,即通過一套運(yùn)營運(yùn)維平臺,讓其定價(jià)、打折、促銷等,只需要在頁面上點(diǎn)擊按鈕即可。以國家超算濟(jì)南中心為例,后端其實(shí)只需要10-20人的團(tuán)隊(duì),就能實(shí)現(xiàn)對于軟件的運(yùn)維,并解決客戶的各類問題。
與此同時(shí),青云AI智算平臺還可幫助客戶解決網(wǎng)絡(luò)交換速度、環(huán)境搭建、多業(yè)務(wù)整合等問題。
除了大幅提升平臺運(yùn)維人員的管理能力外,對于平臺用戶而言,青云也能進(jìn)一步提升AI落地的開發(fā)效率。面向算法工程師,青云提供的開發(fā)主機(jī),已經(jīng)內(nèi)置了一些開發(fā)環(huán)境和IDE環(huán)境,工程師可將Python工程文件等直接傳上去,在線寫代碼、調(diào)試、運(yùn)行,立即找到所需的訓(xùn)練集群。推理完成后,還能實(shí)現(xiàn)算法調(diào)優(yōu),通過算力集群與模型不斷優(yōu)化代碼。
另外,青云還提供了在線訓(xùn)練平臺,將高性能計(jì)算、GPU卡等進(jìn)行集成,在專屬環(huán)境上,青云提供一個(gè)GPU服務(wù)器在線申請構(gòu)建集群,所有的網(wǎng)絡(luò)和環(huán)境均可一鍵生成。同時(shí)青云會根據(jù)行業(yè)內(nèi)常用的模型和小工具進(jìn)行集成。
容器推理平臺支持一鍵部署高性能Kubernetes集群,在推理過程中,如果發(fā)生一些性能上的擁堵,可以實(shí)現(xiàn)負(fù)載均衡、彈性伸縮。
青云還提供了模型倉庫,方便客戶可以通過模型市場立即部署自己的模型,調(diào)用自身的服務(wù)。同時(shí),還能給予模型進(jìn)行微調(diào),或在線通過云平臺的形式一鍵獲取。
總體而言,青云AI智算平臺實(shí)現(xiàn)了像如同管理本地資源般的方式,來管理AI基礎(chǔ)設(shè)施,提供多元算力的智能化調(diào)度,保證算力快速落地。