【賽迪網訊】如果類似的故事在一個人身上發(fā)生了三次,那么,個中緣由肯定不能僅僅用巧合來解釋。相信他的感受也一定很奇特?,F任職于中國網通信息化部的劉云川,就是一個有著如此奇特感受的人。
他的特別感受與IT運行維護有關。這種感受由他三十多年來的職業(yè)生涯累積而成。三十多年來,他一直站在行業(yè)信息化的前沿陣地,擔任過國家“七五”、“九五”重點科技
攻關項目技術負責人,從最初的中國科學院計算中心(1974年)、到中國銀行總行信息科技部(1995年-1998年任高級工程師),輾轉到深圳發(fā)展銀行總行信息科技部(1998年任網絡室經理),再到目前的中國網通信息化部負責CRM建設,他一直深處信息化第一線,幾乎踏著銀行業(yè)、電信業(yè)IT運行維護的脈絡走過。
劉云川親身經歷了三段看似不同卻類似的IT運行維護歷程。每一段歷程又代表了不同性質企業(yè)的IT運維發(fā)展過程。值得一提的是,他還在加拿大大眾銀行總行進修學習過,見識了世界領先的IT運維模式和方法。
在不斷的反芻、咂摸中,劉云川比常人體會到了更深一層的感悟。這份感悟,幾乎算得上一個關于IT運行維護的陳年佳釀。
回想過去的三段經歷,劉云川充滿了激情和激動。在兩個多小時的采訪中,他侃侃而談,中間幾乎沒有任何停頓。
傳統(tǒng)被動的、孤立的、分散的“救火隊”式IT運維管理模式,已經讓IT部門疲憊不堪。如何簡化IT管理,更好地滿足業(yè)務需求,已經成為IT部門的一個重大挑戰(zhàn)。
為了有效地解決行業(yè)用戶在IT運維管理方面的困惑,并推介ITIL在IT運維管理中的價值和意義,我刊策劃了“IT運維診斷面對面系列活動”,活動特別邀請IBM、HP、CA、BMC等IT服務領域的資深運營管理專家,深入了解行業(yè)用戶的IT運維管理現狀,切實為用戶解疑答惑,并共同探討IT運維管理方法和經驗。
本期邀請中國網通控股有限公司運營系統(tǒng)規(guī)劃與開發(fā)部高級經理劉云川,講述了三十多年來他所經歷的銀行業(yè)、電信業(yè)的IT運維故事,以及他的個人體會。
“哪怕是一個只有基礎技術能力的陌生人,也能做專業(yè)IT維護”,這是劉云川對加拿大大眾銀行IT運行維護水平一個整體評價。大眾銀行的所有IT設備都可以遠程監(jiān)控。設備遇到問題,會自動報警,工程師只需要按照系統(tǒng)相關知識庫該設備的操作數據一步一步操作下去就可以。
70年代中到90年代初,劉云川在中國科學院計算中心。根據中-加兩國政府人才培訓協(xié)議,1992年他遠渡重洋來到加拿大大眾銀行總行進修學習。他在該銀行網管中心、呼叫中心呆了一年多。
在大眾銀行一年多的學習和見聞,開闊了他的眼界。他不僅看到了國外銀行業(yè)先進的運作模式,也切身感受到了國外銀行業(yè)領先的IT建設和運行維護模式。
[海外見聞] IT運維自動化
“哪怕是一個只有基礎技術能力的陌生人,也能做銀行專業(yè)IT維護”,這是劉云川對國外銀行IT運行維護水平一個整體評價。
大眾銀行的IT運行維護建立了完整的設備、系統(tǒng)資源管理數據庫和知識庫,包括所有硬件設備的配置情況、所有軟件的參數配置,購買日期、維修記錄等。幾乎所有設備均可通過系統(tǒng)遠程自動化監(jiān)控。
設備遇到問題,會自動報警,以紅色標識顯示在屏幕上,無論是系統(tǒng)自動報警還是使用人員報故障,工程師只需要按照系統(tǒng)相關知識庫的數據,一步一步操作下去就可以,因此,對于工程師來說,不需要很高的技術水平,就可以進行維護支持。正因為如此,剛剛到國外銀行的劉云川很快就能適應。
只要任何一個熱線電話打過來,不管是銀行內部員工,還是外部客戶人員遇到問題,工程師都可以在顯示屏幕上點擊出故障的設備,遠程查看設備的故障問題;查詢有關該設備的詳細情況,之后,會大概判斷出是什么問題,指導客戶一步一步操作,即便不懂什么技術的業(yè)務人員,也能按照他的提示,進行操作處理;如果某個步驟處理不當,只需按照系統(tǒng)數據庫的數據原樣恢復就可以了。
一套運作機制的支撐
是什么支撐著如此先進的運行維護模式?劉云川表示,這與國外銀行的IT建設模式有關。國外銀行IT系統(tǒng)采用了大集中模式,只有一套核心業(yè)務系統(tǒng),對系統(tǒng)的維護支持也都是歸總公司統(tǒng)一部門管理。
具體的運行維護管理,采用了類似ITIL的方法來做運營支持,包括人員設置和流程運作,問題管理、事件管理、變更管理、服務級別管理。
在這套運作機制下,國外銀行設置有專門的熱線支持,共用同一套系統(tǒng)平臺分別接聽處理來自內部員工和外部客戶的各種問題,系統(tǒng)資源高度共享。IT運行維護人員還分為一線支持、二線支持。一線工程師處理一般性問題,其效果不會有太大差別,其后面還有提供二線支持的專家團隊,專門解決一線支持解決不了的疑難問題。由于是全國聯網的數據集中式系統(tǒng),總部只需少量高水平的專家,與國內相比大大減少了人力成本。
十年差距
當然,這段海外學習經歷,也讓劉云川看到了國內外銀行業(yè)之間的差距。
當時,國內銀行業(yè)還沒有開始大集中建設,每家銀行的各個地方分行都單獨建設和維護自己的核心業(yè)務系統(tǒng),都各自配備開發(fā)人員和維護人員。
在運行維護方面,據劉云川介紹,中國銀行業(yè)當時用的調制調解器,基本上都無法對這些設備進行網管控制。
對故障的解決,當時完全依靠運行維護部門的工程師的上門服務。不管問題大小,工程師都要來回去現場解決。遇到一些技術難度大的問題,如果工程師的水平高,處理起來就快;如果水平低,甚至花上幾個小時,可能也解決不了。
劉云川回憶說:“如果比較起來,現在國內銀行業(yè)的IT運行維護管理水平,有點接近國外80年代末90年代初銀行業(yè)的水平,現在銀行IT結構上都采用了大集中模式。盡管從硬件設備上來看,國內銀行不比別人差,甚至還有些領先,但IT運維管理還沒達到國外當時的水平,尤其是呼叫中心、客戶服務方面?!?
目前,以中國銀行、中國工商銀行等為代表的四大國有銀行,以及中小型全國性商業(yè)銀行,都已經建立了大集中模式的IT核心業(yè)務系統(tǒng),其IT運行維護也都采用了集中與分布相結合的模式。最近兩年,中國的銀行業(yè),開始著手探索基于大集中模式的運行維護管理方法,如引入ITIL。
差距不僅僅是IT運維
實際上,國內外銀行業(yè)的差距不僅僅體現在IT運行維護上,在IT應用程度、所有制形式、業(yè)務運作模式以及配套的社會監(jiān)管和法律環(huán)境方面,兩者也大不相同。
劉云川為筆者舉了個例子。在客戶關系管理方面,國外銀行已經能夠根據每個
信用卡客戶的日常消費記錄情況,得出該客戶的消費行為規(guī)律。當某個用戶的消費行為發(fā)生突變時,比如某次消費突然大幅度超出該客戶的日常消費行為規(guī)律時,系統(tǒng)就會及時報警,銀行由此可以善意地提醒客戶,如“信用卡是否被盜”等,總之,銀行替客戶看護他的錢。
除此之外,由于不少國外銀行都是上市企業(yè),因此監(jiān)管部門對銀行建立了一套嚴密的監(jiān)管機制和監(jiān)管方法。
[國內·銀行] 銀行步入集中式運維
僅從風險管理角度來看,大集中增加了作弊的技術難度。大集中之后,幾十人的規(guī)模擴展到了上百人甚至幾百人的團隊,因此集中式運維也面臨諸多挑戰(zhàn)。目前,工商銀行等開始引入ITIL,用流程驅動方法進行管理。
據劉劉云川介紹,八、九十年代,國內銀行業(yè)的IT系統(tǒng)和運行維護都是分散式結構,每家銀行的各個地方分行都單獨建設和維護自己的核心業(yè)務系統(tǒng),并各自配備開發(fā)人員和維護人員。這種分散式結構存在諸多問題。
從投資角度來看,每年銀行的每個分行都要投資IT系統(tǒng)建設,所有投資加起來是一個龐大的數目,而且造成重復投資現象。
從運營成本來看,每個分行的IT系統(tǒng)都需要一個后臺支持系統(tǒng),每個分行都有數據中心,還需要雙機運行,要保證7×24小時運行,并加上開發(fā)用機,各種空調、設備、人力等都要跟上。
從人力支持角度來看,每個分行都需要一定數量的技術專家來進行系統(tǒng)開發(fā)和維護支持,全行幾千人還不夠用,形成龐大的人力成本。
除此之外,還有運維風險、投資風險、道德風險等金融風險問題。
在分散式結構下,盡管總行對每個分行具有管理權限,但每個分行的核心業(yè)務系統(tǒng)仍然歸分行管理,分行對業(yè)務數據具有完全自主的修改能力,這樣情況下,總行難以真正掌握分行的真實業(yè)務情況。
過去,銀行內曾經有一句笑話:利潤是做出來的。以前各分行都是自己管自己,因此作弊的可能性比較大。
劉云川曾經親身經歷過一件“查帳”事件。當時某地分行新任行長在上任之前,強烈要求總行派人先查一下賬,以便了解清楚該分行的家底。盡管該行報上去的數據是小有贏利,但結果讓人吃驚,竟然巨虧額損。
在分散結構下,除了總行對分行的管理上存在風險問題,在分行內部也存在內部員工作案風險。
銀行業(yè)IT部門有一條規(guī)定:開發(fā)、后臺運行維護和前臺應用維護必須嚴格分工;開發(fā)人員不能參與后臺運行和前臺維護業(yè)務,負責后臺系統(tǒng)維護的人可以參與開發(fā)前期方案設計,但不能參與開發(fā)編程工作。如果開發(fā)人員參與后臺運行和前臺維護,就有盜用客戶的賬號和密碼、內部作案的機會。
在分散結構下,維持一個地市級分行IT部門的系統(tǒng)運行、開發(fā)和維護,至少要有幾十個人,為了節(jié)約成本,經常會有IT人員身兼“系統(tǒng)運行、開發(fā)、前臺維護”數職的情況,這樣就容易出漏洞。
整體引入大集中戰(zhàn)略
90年代中、后期,為解決分布式管理存在的諸多弊端,國內銀行業(yè)開始考慮引入國外大集中模式。
劉云川表示,大集中之后,僅從風險管理角度來看,它增加了作弊的技術難度,由于維護歸總行管理,不歸各省自己管,分行事后修改數據的可能性比較小。
尤其是,銀行業(yè)整體上市戰(zhàn)略的考慮,使得大集中建設勢在必行。因為上市公司需要出具年報、季報、月報,這些數據都需要系統(tǒng)來出具。如果數據不準,造成的信息披露有問題,那么“一把手”就要承擔責任。
1995年,中國銀行開始做集中化戰(zhàn)略規(guī)劃。同時期,工商銀行、建設銀行等國有銀行相繼開始大集中建設。隨后,中小型商業(yè)銀行也開始了集中式核心業(yè)務系統(tǒng)建設。自90年代中后期掀起的這股大集中浪潮一直持續(xù)到現在。
兩段大集中體驗
劉云川不僅親身經歷了中國銀行的大集中建設過程,1998年11月擔任深圳發(fā)展銀行總行信息科技部網絡室經理后,他也趕上了深圳發(fā)展銀行的集中式建設。
一個是大型國有全球性商業(yè)銀行,一個是全國性中小型股份制上市商業(yè)銀行,盡管它們分別代表了不同性質、不同運作機制的兩種銀行,但劉云川認為,他們的集中式建設背景和建設過程都非常相像。它們都是從分散走向集中,面臨著上市等諸多現實挑戰(zhàn),尤其是,它們在推進大集中的過程中,也遇到了類似的阻力和困難。
中國銀行先統(tǒng)一銀行應用軟件版本,把400多個地市數據處理中心收縮到31個省中心,然后再收縮成幾大區(qū)域中心;工商銀行收縮成兩個全國中心(兩中心互備);深圳發(fā)展銀行因規(guī)模小,一次完成全國大集中建設。
推行中遇到了種種阻力。盡管中國銀行總行很強勢地推廣新系統(tǒng),推了一年之后,才完成了十幾個省,嚴重影響了新系統(tǒng)、新業(yè)務模式、新產品的推廣和全行整體規(guī)模效益。
首先遇到了來自分行的強烈質疑。當時,不少分行表示,自己的系統(tǒng)在當地應用得很好,甚至部分功能可能比總行的系統(tǒng)還要先進,大集中影響了分行的靈活性。
對此,中行總行非常強硬地要求各分行統(tǒng)一版本。一位總經理的話讓劉云川記憶猶新:“總行系統(tǒng)做得再臭,也要用。你們分行的系統(tǒng)做得再好,為了中國銀行的整體利益,也得下?!鄙钲诎l(fā)展銀行也遇到過這種矛盾。
對于這種矛盾,王劉劉云川有自己的解釋。銀行和電信一樣,都是規(guī)模經濟。如果一個地方有好的業(yè)務模式,那么肯定可以在全國推廣。集中之后,只用在總部修改一下,就可以在全國推廣。一個分行賺100萬,全國都推廣了,規(guī)模效應就上去了,其產生的效益絕對是一個分行的幾十倍。
開始探索ITIL
大集中之后的各種優(yōu)勢已經在銀行業(yè)顯現,但是,集中式運維也開始面臨諸多新挑戰(zhàn)。
大集中之前,各銀行的IT運行維護都由省級、地市級分行自己做,維護人員大概是二、三十個人;IT運維的環(huán)境比較簡單,要求不那么高,“管理方法”達不到國外的水平。
大集中之后,幾十人的規(guī)模擴展到了上百人甚至幾百人的團隊,人多了,而管理者的精力是有限的,這就無法再像以往一樣管理團隊。目前,國內銀行業(yè)如工商銀行開始引入ITIL,采用流程驅動方法,來進行集中式運維管理。
[國內·電信] 電信與銀行有許多相似之處
與銀行業(yè)最初的分散式運行維護結構相同,當前每個電信企業(yè)的各地分公司都有自己獨立的一套業(yè)務系統(tǒng)和開發(fā)維護人員。但不同的是,電信企業(yè)分公司還沒有一個統(tǒng)一集中負責IT建設和運行維護的部門。集中式運行維護是電信業(yè)正在考慮模式。電信企業(yè)與銀行業(yè)有許多相似之處。
2001年7月,劉云川任職于中國網通控股有限公司運營系統(tǒng)規(guī)劃與開發(fā)部高級經理。2001年左右,中國網通控股公司的電信業(yè)務系統(tǒng)開始了集中建設。這讓劉云川第三次體會到了大集中系統(tǒng)建設的風潮。
“集中式運行維護是電信業(yè)正在考慮的模式,”劉云川表示。
十年差距
如果說,國內外銀行業(yè)在IT運行維護上的差距至少是十年。電信業(yè)與國外銀行業(yè)在IT運行維護上也有類似的差距。
與銀行業(yè)最初的分散式運行維護結構相同,當前每個電信企業(yè)的各地分公司都有自己獨立的一套業(yè)務系統(tǒng)和開發(fā)維護人員。但不同的是,電信企業(yè)分公司還沒有一個集中負責IT建設和運行維護的部門,比如電信計費系統(tǒng)由計費部門管理,網絡管理系統(tǒng)由網絡管理中心負責,財務系統(tǒng)由財務部負責等。
追究深層次的原因
造成銀行、電信IT運行維護差距的原因,與各自的業(yè)務性質和系統(tǒng)建設歷史延續(xù)有關。銀行所有業(yè)務部門不管理系統(tǒng),只負責使用;而電信所有業(yè)務都與信息通信技術有關,需要通過計算機來管理使用。這造成了電信企業(yè)過去沒有形成統(tǒng)一的IT管理部門,只能分散在各個業(yè)務部門里。
劉云川認為,深層次原因是公司法人結構的不同。當前,多數電信企業(yè)是二級法人結構,總公司是管理層,省級公司是二級法人。二級法人,意味著每個分公司必須對自己的經營負責,而總公司無需對分公司的經營直接負責。
相比之下,銀行是一級法人,總行必須對整個銀行的經營負責,因此,這促使總行推進了大集中戰(zhàn)略。
形勢正在發(fā)生改變。劉云川表示:“當前電信企業(yè)已經陸續(xù)上市,這意味著電信企業(yè)將從二級法人轉向一級法人。系統(tǒng)的集中建設、統(tǒng)一管理是電信企業(yè)必然要考慮的選擇。僅出具報表一項來說,上市后要發(fā)布準確的數據報告,就必須通過集中式系統(tǒng)和系統(tǒng)互聯來完成。”
實際上,與銀行業(yè)一樣,認識到集中建設的必要性,這些年來,中國電信、中國移 動、中國網通開始了集中系統(tǒng)的試點建設,并設立統(tǒng)一的IT管理部門。比如,中國網通著手建設一些集團統(tǒng)一的系統(tǒng),并成立了企業(yè)信息化信息化部,負責全國集中系統(tǒng)的規(guī)劃工作。