12月20日,主題為“重構云計算·Cloud for AI”的2023百度云智大會·智算大會在北京召開。大會聚焦最前沿技術,分享人工智能行業(yè)變革趨勢,共話智能計算未來可能,百度智能云帶來多項全棧升級并發(fā)布多項創(chuàng)新產品,與客戶、伙伴一起共建繁榮的大模型產業(yè)生態(tài)?;顒悠陂g舉辦了開發(fā)者沙龍,圍繞底層基礎算力、大模型和應用開發(fā)等內容展開深度探討。
會上,百度集團副總裁侯震宇發(fā)表了題為“大模型重構云計算”的主題演講,從大模型、智算基礎設施及AI原生應用開發(fā)平臺三個維度,介紹了百度智能云對于大模型以及云計算領域的業(yè)務布局和思考。侯震宇在演講中表示:“百度智能云以云智一體為核心戰(zhàn)略,對云計算產品與技術體系進行全面重構,進而通過整個百度智能云反饋的能力,加速AI原生應用生態(tài)的繁榮,我們認為只有在行業(yè)客戶的實際場景中落地,有更多的AI原生應用,才能構建出真正的應用生態(tài),才能讓大模型的價值得到充分的發(fā)揮。”
以下為演講實錄:
各位尊敬的嘉賓、開發(fā)者朋友們,大家上午好!
今天可能是2023年最冷的一天,但是看到有這么多的嘉賓朋友們,冒著這種寒冷的天氣來到這里,我確實非常高興。歡迎大家來到2023百度云智大會·智算大會的現(xiàn)場,一起探討大模型時代下,云計算產業(yè)的發(fā)展趨勢與未來。
今天我想給大家分享的主題是:大模型重構云計算,主要來談談百度智能云對于大模型以及云計算領域的業(yè)務布局和思考。
毋庸置疑,以生成式AI為代表大模型是今年行業(yè)的熱點,百度在3月16日發(fā)布了文心一言,3月27日百度智能云也基于文心一言推出了面向企業(yè)客戶的百度智能云千帆大模型平臺。
自8月31日全面開放以后,得益于眾多客戶的支持,近4個月以來,目前千帆平臺上大模型的日調用量增長了10倍,幫助眾多行業(yè)客戶實現(xiàn)了基于大模型能力的業(yè)務創(chuàng)新與升級。
同時,百度智能云自身以大模型為驅動,以云智一體為戰(zhàn)略,持續(xù)高速發(fā)展,據(jù)IDC報告顯示,在AI Cloud市場占有率評估中,百度智能云連續(xù)8次實現(xiàn)占比第一。
我們已經知道:以生成式AI為代表的大模型實現(xiàn)了AI從感知到認知的技術突破,是人工智能發(fā)展史上最大的一次技術躍遷。
特別需要注意的是,大模型不同于以往的AI技術迭代,它同時驅動了底層IT基礎設施的重構,也帶來了上層應用開發(fā)模式的顛覆。
2010年左右,深度學習開始替代傳統(tǒng)統(tǒng)計學的機器學習方法,逐步成為人工智能的主流算法。在移動應用上,深度學習大放異彩,算法模型能力成為很多移動互聯(lián)網企業(yè)的核心競爭力。但是,深度學習僅停留在賦能應用上,并沒有從實質上改變應用的研發(fā)編程范式。
2006年AWS正式發(fā)布了首批云產品(S3和EC2),開啟了經典云計算時代。虛擬化和網絡技術使算力成為一種公共服務,數(shù)字化基礎設施的格局被改變。云原生催生了新的應用架構和開發(fā)方式,大幅提升了移動應用的開發(fā)迭代效率,一定程度助力了移動應用市場的繁榮。
我們可以發(fā)現(xiàn),移動應用、深度學習和云計算三個時代重疊,移動應用市場的蓬勃也受益于深度學習和云計算的發(fā)展,但是從應用、AI技術和IT基礎設施層面仍然是三條平行線獨立演進。
在大模型開啟的AI原生時代,這三條平行線終于迎來了交匯:在應用層,大模型理解、生成、邏輯、記憶的獨特能力會催生AI原生應用研發(fā)新范式,整個應用技術棧、數(shù)據(jù)流和業(yè)務流都將被改變。
與此同時,大模型會成為通用的服務能力,也就是MaaS,大幅降低AI落地的門檻、實現(xiàn)真正的AI普惠。
MaaS終將成為新的基礎服務,其依賴的新型IT基礎設施也將進一步顛覆現(xiàn)有的云計算市場格局。
在這個背景下,百度智能云一直以來,以云智一體為核心戰(zhàn)略,對云計算產品與技術體系進行全面重構,進而通過整個百度智能云反饋的能力,加速AI原生應用生態(tài)的繁榮,我們認為只有在行業(yè)客戶的實際場景中落地,有更多的AI原生應用,才能構建出真正的應用生態(tài),才能讓大模型的價值得到充分的發(fā)揮。
繁榮的AI原生應用生態(tài)構建需要,大模型、智能計算、AI原生應用的研發(fā)新范式三個要素相輔相成。
>>大模型是AI原生應用的大腦,讓它有別于傳統(tǒng)應用的使用體驗。
>>智能計算則為AI原生應用的運行提供堅實支撐,使應用能夠更快地響應客戶需求,迭代模型效果。
>>而AI原生應用研發(fā)的新范式,則幫助開發(fā)者更加高效地基于大模型的能力開發(fā)出應用。
同時數(shù)據(jù)飛輪是開發(fā)AI原生應用的充分必要條件,有了數(shù)據(jù)飛輪,大模型的能力才能夠更加高速地迭代,產品體驗持續(xù)進步,因此數(shù)據(jù)飛輪將極大地加速AI原生應用生態(tài)的繁榮。
百度智能云也是以此為理念,為客戶提供全面的產品和解決方案。我們提供更好效果的大模型,更高資源效能的智算基礎設施,更優(yōu)效率的AI原生應用開發(fā)平臺,同時,提供系統(tǒng)的數(shù)據(jù)飛輪構建方法論和最佳實踐。
下面我也將分別從這三個維度,進一步介紹百度智能云的業(yè)務思考和產品迭代。
>>首先在大模型層面,百度智能云提供業(yè)界領先的MaaS服務平臺,百度智能云千帆大模型平臺,加速大模型產業(yè)落地。
百度智能云千帆大模型平臺提供了豐富好用的基礎大模型,可以支持不同的場景和客戶進行選擇使用。包括文心一言系列模型,以及l(fā)lama,baichuan等行業(yè)開源模型。
>>其次,百度智能云千帆大模型平臺提供了完整易用的大模型工具鏈,在大模型的具體場景落地時,往往基礎大模型不一定完全滿足需求,此時就需要基于場景數(shù)據(jù),對通用的基礎大模型進行精調,壓縮等,為此百度智能云千帆大模型平臺提供了包含了模型評估,模型有監(jiān)督精調,持續(xù)預訓練(Post-Pretrain), RLHF,模型壓縮等全流程的工具鏈。
>>最后,為了幫助客戶基于大模型構建數(shù)據(jù)飛輪,百度智能云千帆大模型平臺提供了數(shù)智一體的數(shù)據(jù)飛輪工具鏈,包括了數(shù)據(jù)管理的全生命周期工具,包括數(shù)據(jù)采集,標注,清洗,增強,回流等。
后面我的同事忻舟也會進一步對于百度智能云千帆大模型平臺的更多迭代升級進行細致解讀。
在AI原生時代基礎設施領域,面向大模型的基礎設施體系也將全面重構,讓計算更智能,這也是去年智算大會的主題,今天也在這里分享一下在基礎設施層面中的全新的思考和進展。
首先我們看一下在AI原生時代的一個典型的系統(tǒng)架構,它將至少包含三部分,模型、數(shù)據(jù)和AI原生應用。
>>在模型部分,包含訓練和推理兩個階段,在訓練階段,基于不同的數(shù)據(jù),將會訓練基礎大模型,行業(yè)大模型和場景大模型,然后進入推理服務環(huán)節(jié),提供API 服務來響應應用系統(tǒng)的需求。
>>在數(shù)據(jù)部分,需要對通用數(shù)據(jù),行業(yè)數(shù)據(jù)和場景數(shù)據(jù)進行很好的存儲,管理和分析工作,以支撐模型和AI應用的數(shù)據(jù)需求。
>>在應用部分,則面向具體場景,以大模型為核心,構建高性能,高可擴展,安全的業(yè)務系統(tǒng),一般包含業(yè)務前端模塊,后端模塊以及面向大模型使用的任務編排和領域知識檢索等模塊。
以上三個部分還需要形成一個有機的整體,幫助應用系統(tǒng)實現(xiàn)高效的數(shù)據(jù)閉環(huán)。
在以上的典型架構下,就需要對于三個維度的基礎設施服務,包括面向模型的智算基礎設施,面向數(shù)據(jù)的數(shù)據(jù)基礎設施以及面向應用的云原生基礎設施進行全面重構,以更好的支撐AI原生應用的系統(tǒng)落地。
>>百度智能云在智算基礎設施的重構層面,發(fā)布了百度百舸·AI異構計算平臺,提供了面向大模型訓推的多芯,高速互聯(lián),高性能存儲以及加速能力。
>>在云基礎設施的重構層面,百度太行計算,網絡產品產品,容器引擎CCE等產品也進行了全面的重構升級,更加彈性,高性能,并具備智能化運維能力。
>>在數(shù)據(jù)基礎設施的重構層面,百度滄海存儲產品,以及數(shù)據(jù)庫GaiaDB面向大模型時代知識的管理和存儲全面升級了向量能力,在大數(shù)據(jù)分析平臺層面,也基于大模型能力進行產品體驗的升級,支持更加智能化的數(shù)據(jù)分析和洞察。
下面我將為大家?guī)戆俣戎悄茉圃诨A設施層面百度智能云全新的產品與能力升級。
首先,為大家?guī)砻嫦虼竽P蛯m梼?yōu)化的智算平臺——百舸3.0。
百舸3.0,核心面向大模型的訓推進行了全面的升級優(yōu)化。
大模型的訓練和推理對于集群的規(guī)模,性能都提出了很高的要求,同時異構AI芯片的投資也是很大的,也需要提升資源利用率以降低業(yè)務成本。
百舸3.0通過在各個層面的優(yōu)化,在各種維度的指標上做到了業(yè)界領先水平,我們的訓練吞吐和推理吞吐相比開源版本分別最高提升了30%和60%。在資源利用率層面,機器的有效訓練時長達到98%,帶寬的有效利用率可以達到95%。在規(guī)模上可以支持萬卡級別超大規(guī)模AI計算,同時提供了豐富的運維和可觀測工具以及容錯保障能力,以提升大規(guī)模集群長期運行的穩(wěn)定性,降低因為資源故障導致訓推任務異常終止的概率,減少業(yè)務損失。
在AI原生時代,智能算力在業(yè)界整體的供給平衡也是個很重要的問題,一方面需要解決部分企業(yè)的算力需求鴻溝,另一方面有些政企構建的智算中心又面臨資源利用率不足的情況,基于此我們正式發(fā)布智算網絡運營平臺,以打造開放的算力生態(tài),滿足業(yè)務場景需求,提升行業(yè)的整體資源利用率。
百度的智算網絡在底層物理層,除了基于百度自建的智算中心,也支持接入第三方智算中心,傳統(tǒng)的IDC資源,邊緣算力資源。這些多種形態(tài)的資源,通過標準API,云原生接口統(tǒng)一接入管理。往上也提供了算網數(shù)據(jù)層和算網編排層,提供智能化的調度能力,包括算力感知,調度,路由和監(jiān)控能力。同時也面向不同的應用場景打造端到端的解決方案。
基于百度的智算網絡,在算力需求端可以更好地滿足客戶的彈性,高性價比的算力需求。在算力供給端,幫助客戶提升資源利用率,有更多渠道的業(yè)務增長。
更多的,我們在基礎設施領域重構產品的進展,下面也會有我的同事謝廣軍做進一步的介紹。
以生成式AI為代表的大模型,讓AI技術的落地產生了新的范式,以前的辨別式AI技術往往針對每個細分場景都要獨立地準備數(shù)據(jù),訓練模型,開發(fā)AI應用,導致了模型的碎片化,落地效率低的問題。而在生成式AI大模型階段,客戶可以基于基礎大模型,直接通過Prompt的方式進行場景適配,也可以按需準備少量的場景數(shù)據(jù)進行模型精調即可取得很好的效果,極大地降低了AI技術落地的門檻。
進一步,我們可以看到以生成式AI為代表的,大模型驅動的AI原生應用的研發(fā)新范式,有如下幾個新的變化:
>>第一:新場景。生成式大語言模型,在生成,理解,推理,記憶等多個維度具有超出預期的能力,出現(xiàn)了智能涌現(xiàn),基于此也催生了很多新的可落地業(yè)務場景應用,例如個人助理,智能文案創(chuàng)作,生成式BI-GBI,編碼助手等。
>>第二:新架構。在這些新的場景大模型具體落地過程中,也產生了很多新的系統(tǒng)架構,例如Assistant,檢索增強RAG架構,智能體Agent架構,相信大家都不陌生。
>>第三:新開發(fā)生態(tài)。以大模型為核心,開發(fā)者工具層也有一些新的工具,包括編排工具LangChain,PromptFlow,RAG工具LLamaIndex等。
這些領域的技術也在發(fā)生日新月異的變化,因此想要開發(fā)一款AI原生應用其實非常復雜,開發(fā)者往往需要做很多工作。比如做技術選型、選模型、找各種工具。
這給企業(yè)和個人開發(fā)者帶來新的挑戰(zhàn)。如快速學習理解相關新技術,在自己的業(yè)務場景實現(xiàn)快速落地,都是現(xiàn)實的問題,針對這些,百度智能云也推出了相關的產品解決方案。
10月17日的百度世界大會上,為了助力AI原生應用的繁榮與高效開發(fā),沈抖博士發(fā)布了AI原生應用開發(fā)工作臺,現(xiàn)在我宣布,AI原生應用開發(fā)工作臺——百度智能云千帆AppBuilder即日起全面開放。
AppBuilder將基于大模型開發(fā)各種應用的常見模式、工具、流程,沉淀成一個工作臺,能夠讓每一個開發(fā)者聚焦在自己的業(yè)務訴求上,不再為研發(fā)過程發(fā)愁。
我們主要提供兩個層面的服務,一個是應用組件,一個是應用框架。
應用組件就是對一些云和AI的能力進行組件化封裝,讓每個組件完成一個特定的功能。AppBuilder不僅提供長文總結、nl2sql等基于大語言模型的能力組件,同時提供像文生圖、語音識別等多模態(tài)的能力組件,以及向量數(shù)據(jù)庫等基礎云和軟硬一體能力組件。
當然直接去用這些組件還是有一些門檻的。所以我們又把這些組件串聯(lián)、組合起來、讓它們可以比較完整地完成一個特定場景的任務,這就是應用框架。現(xiàn)在AppBuilder提供檢索增強生成-RAG、Agent、智能數(shù)據(jù)分析-GBI三個常見的應用框架。
我們提供了兩種產品形態(tài)。
其一是低代碼態(tài),到AppBuilder通過簡單點選,即可獲取對話應用。
開發(fā)者還可以通過代碼的方式,進行更深層次的應用開發(fā)。我們提供面向程序開發(fā)者的開發(fā)套件,包括SDK、開發(fā)環(huán)境和調試工具。應用示例代碼和開發(fā)應用所需要的各種應用組件,開發(fā)者可以在AppBuilder一站式獲取。
不僅僅是大模型,也不僅僅是AI。我們致力于幫助開發(fā)者在百度智能云千帆AppBuilder一站式獲取AI原生應用的全套開發(fā)資源。滿足更靈活、多樣的AI原生應用開發(fā)需求。
稍后,我們的孫珂博士也會帶大家來直接來感受下,基于工作臺搭建一個應用有多簡單。
百度智能云的戰(zhàn)略是云智一體,深入產業(yè),生態(tài)繁榮,AI普惠。在這個AI原生的時代,我們也將持續(xù)努力,推出有競爭力的產品方案,讓AI技術普惠可得,和生態(tài)伙伴一起,持續(xù)深入客戶場景,幫助客戶實現(xiàn)數(shù)智化升級,有更多的AI原生應用創(chuàng)新涌現(xiàn)。
我的分享就到這里,謝謝大家!