隨著科學(xué)技術(shù)的飛速發(fā)展與計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,在人類生產(chǎn)生活的各個(gè)領(lǐng)域產(chǎn)生了大量數(shù)據(jù),由此催生了具備強(qiáng)大儲(chǔ)存查詢功能的數(shù)據(jù)庫(kù)技術(shù)。但是面對(duì)每分每秒不斷產(chǎn)生的數(shù)據(jù),人們不再滿足于對(duì)這些數(shù)據(jù)單純的查詢功能,進(jìn)一步要求“用數(shù)據(jù)說話”:利用數(shù)據(jù)提取有益信息,形成知識(shí)為決策服務(wù)。這一要求就數(shù)據(jù)庫(kù)技術(shù)而言已經(jīng)顯得無能為力了,同樣,傳統(tǒng)的統(tǒng)計(jì)科學(xué)也面臨了極大的挑戰(zhàn)。于是,一種依托于統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)等科學(xué)的交叉學(xué)科——數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
“數(shù)據(jù)挖掘”(Data Mining)是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析,如查詢、報(bào)表、OLAP(聯(lián)機(jī)應(yīng)用分析)、統(tǒng)計(jì)分析等數(shù)據(jù)分析技術(shù)的本質(zhì)區(qū)別在于,數(shù)據(jù)挖掘是在明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。
作為一門應(yīng)用技術(shù),數(shù)據(jù)挖掘可謂涵蓋廣泛。尤其在發(fā)達(dá)國(guó)家,數(shù)據(jù)挖掘技術(shù)的觸角已經(jīng)伸向了各行各業(yè),尤其是在銀行業(yè)。典型的例子就是信用卡,用數(shù)據(jù)挖掘技術(shù)來分析銀行客戶的信用等級(jí)和資產(chǎn)發(fā)展趨勢(shì),用以規(guī)避銀行風(fēng)險(xiǎn)。現(xiàn)在,由于各行業(yè)業(yè)務(wù)信息化的實(shí)現(xiàn),商業(yè)領(lǐng)域產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)或是為了分析的目的而收集,或是通過純粹的商業(yè)運(yùn)作而自然產(chǎn)生。分析這些數(shù)據(jù)不再是單純?yōu)榱搜芯康男枰?,更主要是為商業(yè)決策提供真正有價(jià)值的支持信息。目前所有企業(yè)面臨的一個(gè)共同問題是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價(jià)值的信息卻很少。因此就要求通過數(shù)據(jù)挖掘技術(shù)的使用對(duì)大量的數(shù)據(jù)進(jìn)行深層分析,獲得有利于商業(yè)決策的信息。
數(shù)據(jù)挖掘作為信息技術(shù)發(fā)展的關(guān)鍵技術(shù)正顯現(xiàn)出其巨大的商業(yè)價(jià)值,在金融領(lǐng)域尤其如此。經(jīng)濟(jì)的全球化和我國(guó)加入WTO,使中國(guó)金融行業(yè)在市場(chǎng)競(jìng)爭(zhēng)中面臨著前所未有的機(jī)遇和挑戰(zhàn)。隨著中國(guó)經(jīng)濟(jì)的騰飛,居民個(gè)人和家庭逐漸成為社會(huì)財(cái)富的主體,這使得零售業(yè)務(wù)成為中國(guó)金融行業(yè)的主戰(zhàn)場(chǎng)。中國(guó)金融企業(yè),特別是商業(yè)銀行,迫切需要將市場(chǎng)營(yíng)銷理念從“產(chǎn)品導(dǎo)向”迅速轉(zhuǎn)變?yōu)椤翱蛻魧?dǎo)向”。在這場(chǎng)劃時(shí)代的金融改革中,數(shù)據(jù)挖掘技術(shù)將成為協(xié)助中國(guó)金融行業(yè)成功轉(zhuǎn)型的一把利刃。
客戶概況:對(duì)癥下藥 提高客戶的潛在價(jià)值
美國(guó)北達(dá)科他州第一國(guó)民銀行發(fā)現(xiàn),10%的客戶提供了銀行幾乎所有的利潤(rùn)。舊金山的美國(guó)銀行也發(fā)現(xiàn),一小部分客戶,大約在20%左右,他們決定了銀行的盈利情況。美國(guó)銀行收集了其高端客戶的資料來進(jìn)行研究以決定提供的服務(wù)。在數(shù)據(jù)挖掘中,客戶概況的意義就在于幫助企業(yè)識(shí)別出最具價(jià)值的客戶群,對(duì)癥下藥,對(duì)不同客戶施以不同管理方式??蛻舾艣r也是客戶關(guān)系管理(以下簡(jiǎn)稱CRM,Customer Relationship Management)中的核心部分。
企業(yè)客戶大體可分為機(jī)構(gòu)客戶和零售客戶。中國(guó)傳統(tǒng)的金融業(yè)務(wù)側(cè)重在對(duì)機(jī)構(gòu)客戶的關(guān)系維護(hù)與拓展上,缺乏對(duì)零售客戶的管理。而在發(fā)達(dá)國(guó)家和地區(qū)的金融企業(yè)中,零售客戶業(yè)務(wù)的比重通常都在50%以上。由于零售業(yè)務(wù)涉及居民的生活、消費(fèi)、投資等方方面面,與證券、保險(xiǎn)、基金等多個(gè)金融市場(chǎng)有著非常強(qiáng)的交叉性、連帶性,業(yè)務(wù)創(chuàng)新的空間廣闊。正如國(guó)務(wù)院發(fā)展研究中心金融研究所副所長(zhǎng)巴曙松所說,2006年底中國(guó)入世5年保護(hù)期滿,主流外資銀行將正式在中國(guó)展開與國(guó)內(nèi)商業(yè)銀行的激戰(zhàn),而競(jìng)爭(zhēng)的焦點(diǎn)將是人民幣零售業(yè)務(wù)。
數(shù)據(jù)挖掘技術(shù)正是在管理零售客戶這一領(lǐng)域具有強(qiáng)大的技術(shù)優(yōu)勢(shì)。例如,中國(guó)工商銀行正在同中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心開展合作,應(yīng)用該中心所獨(dú)有的數(shù)據(jù)挖掘技術(shù)方法與模型對(duì)其客戶群進(jìn)行科學(xué)分類,對(duì)個(gè)人客戶群行為特征以及個(gè)人客戶貢獻(xiàn)度分布規(guī)律數(shù)據(jù)進(jìn)行深度挖掘、分析和提煉,發(fā)現(xiàn)蘊(yùn)藏在復(fù)雜數(shù)據(jù)中的反映顧客風(fēng)險(xiǎn)特征和客戶忠誠(chéng)度的知識(shí)和規(guī)律,以便為中國(guó)工商銀行的個(gè)人客戶分類、風(fēng)險(xiǎn)管理、市場(chǎng)營(yíng)銷等提供科學(xué)依據(jù)。
CRM應(yīng)用相應(yīng)的技術(shù)來監(jiān)控客戶服務(wù),通過數(shù)據(jù)挖掘技術(shù)可以有效地增強(qiáng)這一功能,了解每一個(gè)客戶對(duì)公司的價(jià)值,使得決策者可以更合理地決定為保留某個(gè)客戶支付更多的費(fèi)用是否值得。銀行業(yè)中的數(shù)據(jù)挖掘有很多種機(jī)會(huì)。Deloitte咨詢發(fā)現(xiàn)只有31%的銀行曾經(jīng)確定它們現(xiàn)有的費(fèi)用分配是反映了客戶需求的。Kathleen Khirallah,The Tower集團(tuán)的分析師,預(yù)測(cè)美國(guó)銀行界在CRM系統(tǒng)上的支出將以每年11%的速度增長(zhǎng)。
而在中國(guó)的金融領(lǐng)域,CRM及其相應(yīng)技術(shù)的應(yīng)用水平相比于西方成熟金融市場(chǎng),還有很大的成長(zhǎng)空間。以信用卡客戶為例,自上世紀(jì)90年代前期開始,中國(guó)境內(nèi)個(gè)人信用卡業(yè)務(wù)以井噴的態(tài)勢(shì)發(fā)展(如圖1所示)。然而截至今日,實(shí)現(xiàn)信用卡業(yè)務(wù)盈利的國(guó)內(nèi)商業(yè)銀行寥寥無幾,根本原因在于銀行對(duì)持卡客戶并不了解,缺乏量體裁衣式的客戶管理。實(shí)踐證明信用卡行業(yè)利潤(rùn)是相當(dāng)豐厚的。它吸引了很多境外銀行進(jìn)行發(fā)卡,并且很多持卡人都擁有4到5張信用卡。大通曼哈頓銀行分析部副總裁Michael Eichorst聲稱,發(fā)卡行如果想提高利潤(rùn)率,除了將數(shù)據(jù)庫(kù)營(yíng)銷作為自己的核心競(jìng)爭(zhēng)力之外,別無他法。
渣打銀行是國(guó)際零售銀行業(yè)的領(lǐng)頭羊之一。其信用卡業(yè)務(wù)的成功秘訣在于:把客戶數(shù)據(jù)提煉成客戶知識(shí),利用數(shù)據(jù)挖掘技術(shù)成功進(jìn)行CRM管理,使客戶使用該行信用卡的時(shí)間延長(zhǎng)、次數(shù)增加,關(guān)聯(lián)銷售業(yè)績(jī)上升,從而使利潤(rùn)率整體提高。如何做到這一點(diǎn)呢?如圖2所示,首先渣打銀行利用已有數(shù)據(jù)庫(kù),按照客戶特征(包括購(gòu)買行為、主要服務(wù)需求、人口學(xué)特征、產(chǎn)品使用情況、客戶關(guān)系、價(jià)格敏感度等等考核項(xiàng)目),對(duì)客戶進(jìn)行分類(Customer Segmentation)。針對(duì)不同的客戶類型(例如大客戶類型,潛在價(jià)值高,但是忠誠(chéng)度很難保持)設(shè)計(jì)出量體裁衣的產(chǎn)品組合、溝通方式,以及客戶服務(wù),從而達(dá)到提高客戶忠誠(chéng)度、實(shí)現(xiàn)關(guān)聯(lián)銷售、最優(yōu)化定價(jià)、產(chǎn)品直銷、產(chǎn)品再設(shè)計(jì),以及渠道管理的目的。而這些目標(biāo)的實(shí)現(xiàn),致使客戶管理總體成本降低,客戶關(guān)系得以改善,最終成功實(shí)現(xiàn)零售業(yè)務(wù)塊利潤(rùn)率的提高。
評(píng)分技術(shù):給客戶直觀量化的分?jǐn)?shù)
銀行界廣泛使用的另一種數(shù)據(jù)挖掘工具就是評(píng)分技術(shù)。這些評(píng)分包括風(fēng)險(xiǎn)評(píng)分、行為評(píng)分、收益率評(píng)分,征信局評(píng)分,行業(yè)評(píng)分以及客戶評(píng)分等。評(píng)分技術(shù)將顧客的海量信息數(shù)據(jù)以某種權(quán)重加以衡量,針對(duì)各種目標(biāo)給出量化評(píng)分。
以征信局評(píng)分為例。要達(dá)到建立征信局評(píng)分的目標(biāo),首先要建立起集中的數(shù)據(jù)倉(cāng)庫(kù),其中涵蓋了申請(qǐng)人的各種特征,銀行提供的所有產(chǎn)品,包括存款、貸款、信用卡、保險(xiǎn)、年金、退休計(jì)劃、證券承銷,以及銀行提供的其他產(chǎn)品,甚至包括水電煤氣、電話費(fèi)、租金的繳納情況等。
信用評(píng)分通過由數(shù)據(jù)挖掘模型確定的權(quán)重來給每個(gè)申請(qǐng)的各個(gè)指標(biāo)打分,加總得到該申請(qǐng)人的信用評(píng)分情況。銀行根據(jù)信用評(píng)分來決定是否接受申請(qǐng),同時(shí)也通過信用評(píng)分來確定信用額度。過去,信用評(píng)分的工作是由銀行的信貸員完成的,他們只考慮幾個(gè)經(jīng)過測(cè)試的變量,比如就業(yè)情況、收入、年齡、資產(chǎn)、負(fù)債和貸款歷史。專業(yè)的征信機(jī)構(gòu)應(yīng)用數(shù)據(jù)挖掘的方法則能夠增加更多的變量,同時(shí)提高模型的精度。
為推動(dòng)征信業(yè)發(fā)展,中國(guó)人民銀行1998年開始籌建銀行信貸登記咨詢系統(tǒng),通過政府投資建立數(shù)據(jù)庫(kù),先后將全國(guó)1000多萬企業(yè)和5.6億自然人的銀行貸款信息納入其中,于2005年實(shí)現(xiàn)全國(guó)聯(lián)網(wǎng)運(yùn)行,滿足銀行監(jiān)管和商業(yè)銀行貸款查詢的需要。
目前,中國(guó)人民銀行正在聯(lián)手中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)挖掘研究中心對(duì)該征信系統(tǒng)進(jìn)行升級(jí):在個(gè)人征信數(shù)據(jù)庫(kù)的基礎(chǔ)上,以足夠大的樣本量,運(yùn)用具有獨(dú)創(chuàng)性知識(shí)產(chǎn)權(quán)且國(guó)際領(lǐng)先的數(shù)據(jù)挖掘方法和手段,建立一個(gè)能適合于中國(guó)現(xiàn)狀并且具有實(shí)際運(yùn)用價(jià)值的個(gè)人評(píng)分模式。
這個(gè)評(píng)分模型將運(yùn)用500多個(gè)衍生變量,對(duì)數(shù)據(jù)庫(kù)內(nèi)的個(gè)體進(jìn)行評(píng)分,預(yù)測(cè)該個(gè)體未來的風(fēng)險(xiǎn)系數(shù)。分?jǐn)?shù)越高壞賬風(fēng)險(xiǎn)越低,分?jǐn)?shù)越低風(fēng)險(xiǎn)越高。這一評(píng)分系統(tǒng)將幫助信貸員快速準(zhǔn)確地做出放貸決定,同時(shí)也可以保證銀行系統(tǒng)內(nèi)部放貸標(biāo)準(zhǔn)的統(tǒng)一。這一評(píng)分系統(tǒng)具有涵蓋面廣、使用成本低、建設(shè)速度快等特點(diǎn),它與各銀行已有的客戶評(píng)分相輔相成,為商業(yè)銀行實(shí)現(xiàn)更完善的風(fēng)險(xiǎn)控制,并為客戶管理奠定堅(jiān)實(shí)的基礎(chǔ)。
購(gòu)物籃分析:關(guān)聯(lián)營(yíng)銷的有力工具
購(gòu)物籃分析的意義在于確定并預(yù)測(cè)消費(fèi)者商品購(gòu)買行為,這些信息有助于產(chǎn)品定位和關(guān)聯(lián)銷售。購(gòu)物籃分析主要調(diào)查顧客傾向于如何購(gòu)買產(chǎn)品,一般是怎樣的產(chǎn)品組合。這包括同時(shí)所購(gòu)買的商品,如牛奶和餅干,或者面包、黃油和果醬。當(dāng)然也包括序列關(guān)系的購(gòu)買,如購(gòu)買房子后接著買家具,或買車后一年或二年買新輪胎。顧客的購(gòu)買趨勢(shì)信息以及購(gòu)買時(shí)間信息對(duì)于零售業(yè)非常有價(jià)值。例如,星期一晚上足球賽一般可以刺激星期一下午的銷售,所以商家應(yīng)該保證有充足的啤酒和土豆片存放在貨架上。ACNielsen-US主席史蒂夫斯密特描述了購(gòu)物籃分析的一些好處:“購(gòu)物籃分析在宣傳和推銷戰(zhàn)略的有效選擇方面是非常重要的。它能揭示消費(fèi)者的隱含消費(fèi)模式,識(shí)別促銷產(chǎn)品的有利機(jī)會(huì)?!睌?shù)據(jù)挖掘分析過程不僅包括識(shí)別這些關(guān)聯(lián),還包括尋找這些關(guān)聯(lián)的原因,以及提出增加總利潤(rùn)的方法。
購(gòu)物籃的技術(shù)已經(jīng)被廣泛應(yīng)用在西方金融行業(yè)企業(yè)中,它可以成功預(yù)測(cè)銀行客戶需求。一旦獲得了這些信息,銀行就可以改善自身營(yíng)銷。現(xiàn)在銀行天天都在開發(fā)新的溝通客戶的方法。各銀行在自己的ATM機(jī)上就捆綁了顧客可能感興趣的本行產(chǎn)品信息,供使用本行ATM機(jī)的用戶了解。如果數(shù)據(jù)庫(kù)中顯示,某個(gè)高信用限額的客戶更換了地址,這個(gè)客戶很有可能新近購(gòu)買了一棟更大的住宅,因此會(huì)有可能需要更高信用限額,更高端的新信用卡,或者需要一個(gè)住房改善貸款,這些產(chǎn)品都可以通過信用卡賬單郵寄給客戶。當(dāng)客戶打電話咨詢的時(shí)候,數(shù)據(jù)庫(kù)可以有力地幫助電話銷售代表。銷售代表的電腦屏幕上可以顯示出客戶的特點(diǎn),同時(shí)也可以顯示出顧客會(huì)對(duì)什么產(chǎn)品感興趣。
數(shù)據(jù)挖掘與保險(xiǎn)行業(yè)
近年來,中國(guó)保險(xiǎn)業(yè)持續(xù)高速增長(zhǎng),尤其是人身保險(xiǎn)呈現(xiàn)井噴態(tài)勢(shì)。盡管近期中國(guó)保險(xiǎn)業(yè)增長(zhǎng)強(qiáng)勁,但相對(duì)來說仍處于發(fā)展初期。2003年,中國(guó)保險(xiǎn)深度達(dá)到3.33%,保險(xiǎn)密度達(dá)到287.44元。但與同期全球平均保險(xiǎn)深度8.06%,平均保險(xiǎn)密度469.6美元相比,我國(guó)保險(xiǎn)市場(chǎng)的密度和深度都處于很低的水平。
數(shù)據(jù)挖掘技術(shù)在西方保險(xiǎn)行業(yè)有多年成功的運(yùn)作實(shí)踐,可以協(xié)助保險(xiǎn)業(yè)公司解決保險(xiǎn)產(chǎn)品開發(fā)、定價(jià)、保單審核、欺詐檢驗(yàn)、破產(chǎn)預(yù)測(cè)、客戶管理分類等多項(xiàng)復(fù)雜業(yè)務(wù)。
例如,保險(xiǎn)公司都會(huì)有一個(gè)大型數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),記錄每項(xiàng)交易和索賠細(xì)節(jié)。分析的目的就是準(zhǔn)確地預(yù)測(cè)索賠的平均成本及頻率,并且檢測(cè)收益率的價(jià)格影響。特定的決策是設(shè)定保險(xiǎn)產(chǎn)品的價(jià)格,達(dá)到增加市場(chǎng)份額、保持現(xiàn)有的客戶以及增加收益率。保險(xiǎn)業(yè)的成功定價(jià)需要預(yù)測(cè)多少顧客有可能重新更新他們的保單(policy),測(cè)算他們的風(fēng)險(xiǎn)水平以及他們對(duì)價(jià)格上漲的敏感度。數(shù)據(jù)挖掘技術(shù)的應(yīng)用將會(huì)協(xié)助中國(guó)保險(xiǎn)企業(yè)完成健康、高效和可持續(xù)性的發(fā)展。
目前,中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心正與中國(guó)再保險(xiǎn)(集團(tuán))公司合作開展研究,制定在中國(guó)全面開展再保險(xiǎn)業(yè)務(wù)的商業(yè)戰(zhàn)略政策。
(作者石勇為中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心常務(wù)副主任,中國(guó)科學(xué)院研究生院管理學(xué)院副院長(zhǎng)、教授、博士生導(dǎo)師;作者張悅為中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心助理研究員)
來源:《資本市場(chǎng)》