BI新趨勢(shì)2:向云遷移
SaaS BI的流行可以看作是BI向云遷移的一個(gè)步驟或環(huán)節(jié)。雖然不同的BI供應(yīng)商的說(shuō)法有所區(qū)別,但向SaaS的轉(zhuǎn)型和向云的遷移在方向上是基本一致的。雖然在目前,大多數(shù)的機(jī)構(gòu)都是在內(nèi)部解決BI問(wèn)題,但是在未來(lái)的三年中,這一狀況有望徹底改觀。
一項(xiàng)在2010年5月進(jìn)行的CIO調(diào)查發(fā)現(xiàn),約有五分之一(23%)的受訪者預(yù)計(jì),云或SaaS(軟件即服務(wù))將在三年內(nèi)成為其主要的BI解決方案。這比當(dāng)前7%的水平有了大幅度提升。此項(xiàng)調(diào)查涉及335位在企業(yè)內(nèi)部使用BI和分析工具的CIO。
不過(guò),盡管云BI解決方案的潛力巨大,但企業(yè)內(nèi)部的BI解決方案仍然占據(jù)著支配地位。調(diào)查還顯示,有93%的受訪問(wèn)者仍在使用企業(yè)內(nèi)部的BI工具,而且有77%的受訪者預(yù)計(jì),將在未來(lái)的1~3年中繼續(xù)使用內(nèi)部BI工具。也有企業(yè)的CIO堅(jiān)稱,將繼續(xù)沿用內(nèi)部解決方案。他們給出的理由是,企業(yè)擁有太多的異構(gòu)系統(tǒng),要想部署云會(huì)非常困難。
盡管BI向云遷移的過(guò)程中還面臨許多的問(wèn)題,但隨著越來(lái)越多的企業(yè)將其業(yè)務(wù)應(yīng)用置于云端,“在云中部署B(yǎng)I”絕不是一個(gè)遙不可及的目標(biāo)。在數(shù)據(jù)集成領(lǐng)域,專業(yè)廠商Informatica已經(jīng)進(jìn)行了向用戶交付云服務(wù)的嘗試。2010年6月,Informatica Cloud 2010夏季版全面上市。此前該公司發(fā)布的Informatica 9數(shù)據(jù)集成平臺(tái)已經(jīng)能夠同時(shí)部署在預(yù)裝系統(tǒng)或“云”網(wǎng)絡(luò)之中,為用戶提供云端集成能力。
基于云的BI要完全替代傳統(tǒng)BI還要假以時(shí)日,但云計(jì)算在全球的盛行,必將對(duì)BI向云的遷移進(jìn)程產(chǎn)生積極的影響。有分析人士指出,BI領(lǐng)域內(nèi)充分的競(jìng)爭(zhēng)導(dǎo)致了價(jià)格的下降,這也意味著該領(lǐng)域的參與者正面臨更為激烈的競(jìng)爭(zhēng)局面。云的重要性已經(jīng)能夠影響到BI廠商未來(lái)的生存。從一定意義上說(shuō),只有產(chǎn)品是面向云規(guī)模架構(gòu)設(shè)計(jì)并符合云運(yùn)營(yíng)模式的廠商才能在未來(lái)取得成功。
BI新趨勢(shì)3:融合,再融合
數(shù)據(jù)質(zhì)量、數(shù)據(jù)集成和數(shù)據(jù)虛擬化將與主數(shù)據(jù)管理融合,構(gòu)成處理結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一信息管理平臺(tái)。眾所周知,自數(shù)據(jù)管理系統(tǒng)出現(xiàn)以來(lái),數(shù)據(jù)質(zhì)量一直是IT系統(tǒng)的一大痛處。它困擾著許多企業(yè)的CIO和IT人員,造成系統(tǒng)部署、生產(chǎn)力和時(shí)間成本上的巨大損失。從技術(shù)的發(fā)展趨勢(shì)上分析,數(shù)據(jù)質(zhì)量和數(shù)據(jù)集成將實(shí)現(xiàn)更為緊密的整合,從而在底層解決數(shù)據(jù)質(zhì)量的問(wèn)題,讓正確、純凈的數(shù)據(jù)進(jìn)入應(yīng)用的下游。
SAP BusinessObjects、SAS、Informatica及Talend等公司目前都可以在某種程度上提供上述能力。此外,由于企業(yè)中的數(shù)據(jù)源呈現(xiàn)爆炸式增長(zhǎng),為了能夠把所有數(shù)據(jù)源集成到單一物理位置并保持存取的靈活性,Composite等廠商為客戶提供數(shù)據(jù)虛擬化能力。借助這種能力,規(guī)范的信息模型可以覆蓋在信息資產(chǎn)的頂部。不管這些信息資產(chǎn)位于何處,規(guī)范的信息模型都能夠處理批量、實(shí)時(shí)和事件數(shù)據(jù)源組合。這些全異的數(shù)據(jù)源必須通過(guò)主數(shù)據(jù)管理能力來(lái)協(xié)調(diào)。通過(guò)這種能力,客戶、供應(yīng)商、產(chǎn)品等企業(yè)中的關(guān)鍵實(shí)現(xiàn)定義可以被用于提供這些分散的數(shù)據(jù)源之上的語(yǔ)義統(tǒng)一。最后,結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息,都能利用文本分析能力和數(shù)據(jù)虛擬化技術(shù),從一個(gè)無(wú)處不在的信息管理平臺(tái)實(shí)現(xiàn)數(shù)據(jù)的提取、轉(zhuǎn)換、加載與查詢。
BI世界醞釀融合的另一趨勢(shì)是,有越來(lái)越多的數(shù)據(jù)挖掘、預(yù)測(cè)分析能力被引入到數(shù)據(jù)庫(kù)系統(tǒng)之中。回顧歷史,雖然以分析為中心的OLAP(聯(lián)機(jī)分析處理)數(shù)據(jù)庫(kù)已經(jīng)問(wèn)世幾十年(以甲骨文Express、Hyperion Essbase和微軟的Analysis Services為代表),但是它們從未在數(shù)據(jù)庫(kù)市場(chǎng)真正占據(jù)統(tǒng)治地位。過(guò)去的數(shù)十年,RDBMS(關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng))一直是市場(chǎng)的主宰,應(yīng)用的類型似乎并不重要,關(guān)系型數(shù)據(jù)庫(kù)才是核心與關(guān)鍵。
而在今天的海量數(shù)據(jù)時(shí)代,傳統(tǒng)數(shù)據(jù)管理的顛覆與變革已經(jīng)無(wú)法回避。Google(BigTable)、Yahoo (Hadoop)、Amazon(Dynamo)、Facebook(Cassandra)等大型Web廠商紛紛自行開發(fā)解決方案,以處理由互聯(lián)網(wǎng)應(yīng)用產(chǎn)生的海量數(shù)據(jù)。另一方面,專注于分析性工作負(fù)載的數(shù)據(jù)庫(kù)產(chǎn)品正在形成集群效應(yīng)。掌握內(nèi)存處理、利用并行機(jī)制、柱狀存儲(chǔ)選擇等創(chuàng)新技術(shù)的Netezza、Greenplum、Vertica、Aster Data等新興廠商不斷發(fā)展壯大。
在這些新的數(shù)據(jù)庫(kù)產(chǎn)品的引擎中,具備了可編程性和并行處理能力。這種可編程能力讓開發(fā)人員能夠?qū)⒂?jì)算遷移到數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部,避免了因數(shù)據(jù)遷移所造成的響應(yīng)緩慢問(wèn)題。另外,配合并行、大規(guī)模并行處理(MPP)架構(gòu)的性能和擴(kuò)展性優(yōu)勢(shì),用戶可以獲得高吞吐量,以及用于欺詐探測(cè)、風(fēng)險(xiǎn)管理等目的的運(yùn)營(yíng)分析能力。
BI新趨勢(shì)4:開源BI進(jìn)入成熟期
采用本地運(yùn)行模式的傳統(tǒng)BI不僅面臨著云或SaaS應(yīng)用模式的沖擊,開源BI同樣也是一個(gè)關(guān)鍵的顛覆者。開源BI的開發(fā)者希望改寫閉源、傳統(tǒng)BI占統(tǒng)治地位的市場(chǎng)格局,而他們已經(jīng)在這條道路上付出了長(zhǎng)期的努力。
經(jīng)濟(jì)危機(jī)及其引發(fā)的持續(xù)經(jīng)濟(jì)低迷,為開源BI提供了發(fā)展的良機(jī)。面對(duì)緊縮的IT預(yù)算,很多企業(yè)發(fā)現(xiàn),基于開源BI的數(shù)據(jù)分析、報(bào)表制作或數(shù)據(jù)集成,能夠讓它們以有限的資金,高效率地解決實(shí)際問(wèn)題。
借助開源BI解決方案,用戶可以以構(gòu)建傳統(tǒng)BI應(yīng)用幾分之一的費(fèi)用,搭建完整的端到端BI棧。而這種選擇還可以獲得良好的自上而下的采用率。這應(yīng)該是企業(yè)應(yīng)對(duì)嚴(yán)酷經(jīng)濟(jì)形勢(shì)的一種生存之道。而在端到端的BI棧中,很多產(chǎn)品已經(jīng)達(dá)到或接近了閉源BI工具的應(yīng)用成熟度水平。在報(bào)表、OLAP、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)集成、主數(shù)據(jù)管理等領(lǐng)域,企業(yè)用戶均可以找到經(jīng)濟(jì)、高效的開源BI工具(市場(chǎng)上主要開源BI工具如附表所示)。(更多內(nèi)容詳見(jiàn)http://www.cnw.com.cn/P/2661)
編看編想
數(shù)據(jù)的爆炸式增長(zhǎng),以及針對(duì)海量數(shù)據(jù)的分析需求,讓BI的市場(chǎng)版圖持續(xù)擴(kuò)充,并將由此導(dǎo)致整個(gè)技術(shù)疆界的再定義。今天,電子郵件、文檔、視頻等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)被納入到BI的勢(shì)力范圍中,同時(shí)自助式報(bào)表和混搭應(yīng)用變得更加普及。BI將從一種IT活動(dòng)演變?yōu)橐环N受到用戶業(yè)務(wù)驅(qū)動(dòng)而演進(jìn)的應(yīng)用方式。
在互聯(lián)網(wǎng)時(shí)代,其海量數(shù)據(jù)多向交互的特性,有望激發(fā)更多的BI技術(shù)創(chuàng)新。云BI、混搭和高級(jí)可視化技術(shù)已經(jīng)出現(xiàn),并積極融入主流的BI應(yīng)用之中。而數(shù)據(jù)量級(jí)的增長(zhǎng)速度也是十分驚人的。TB字節(jié)已經(jīng)是過(guò)去式,而PB字節(jié)即將成為主流,而EB(Exabytes)和ZB(Zettabytes)字節(jié)也開始出現(xiàn)了。面對(duì)如此龐大的數(shù)據(jù)量,機(jī)構(gòu)必須嘗試全新的處理技術(shù)。例如專用設(shè)備、柱狀數(shù)據(jù)庫(kù)和Hadoop這樣的分布式應(yīng)用。
另外,BI技術(shù)的演進(jìn)并非僅駐留在內(nèi)部數(shù)據(jù)中心或云端,移動(dòng)分析也是一個(gè)重要的發(fā)展方向。2010年,全球移動(dòng)用戶數(shù)量已經(jīng)突破50億。目前,領(lǐng)先的商業(yè)BI廠商紛紛涉足移動(dòng)分析市場(chǎng)。基于移動(dòng)BI技術(shù),用戶可以通過(guò)智能手機(jī)提交數(shù)據(jù),并獲取分析報(bào)告。而具備了GPS功能的智能手機(jī)還能夠?qū)?ldquo;位置”信息引入BI,為數(shù)據(jù)分析增加了新的維度。